public class OfficeExtractor extends java.lang.Object implements IFileParser
| 构造器和说明 |
|---|
OfficeExtractor() |
| 限定符和类型 | 方法和说明 |
|---|---|
static java.lang.String |
docTextFilter(java.lang.String str)
将解析office文档的text内容进行过滤,过滤到乱码。
|
java.io.Reader |
getContentReader() |
java.lang.String |
getContentString()
已过时。
废弃别再使用
|
java.lang.String |
getContentString(java.lang.String... mimeType)
支持Office2003(Word,Excel,PowerPoint,Visio)
支持Office2007(Word,Excel,PowerPoint,Visio)
如果需要解析Excel,需要传入mimeType参数
IFileParser.MIME_XLS:2003格式的Excel IFileParser.MIME_XLSX:2007格式的Excel |
java.lang.String |
getMetadata(java.lang.String metadataname) |
java.lang.String |
getTitle() |
void |
setFile(com.seeyon.ctp.common.file.model.CtpAbstractFile file) |
public java.io.Reader getContentReader()
getContentReader 在接口中 IFileParserpublic java.lang.String getContentString(java.lang.String... mimeType)
file - public java.lang.String getMetadata(java.lang.String metadataname)
getMetadata 在接口中 IFileParserpublic java.lang.String getTitle()
getTitle 在接口中 IFileParserpublic void setFile(com.seeyon.ctp.common.file.model.CtpAbstractFile file)
setFile 在接口中 IFileParserpublic static java.lang.String docTextFilter(java.lang.String str)
str - public java.lang.String getContentString()
getContentString 在接口中 IFileParser