public class OfficeExtractor extends java.lang.Object implements IFileParser
构造器和说明 |
---|
OfficeExtractor() |
限定符和类型 | 方法和说明 |
---|---|
static java.lang.String |
docTextFilter(java.lang.String str)
将解析office文档的text内容进行过滤,过滤到乱码。
|
java.io.Reader |
getContentReader() |
java.lang.String |
getContentString()
已过时。
废弃别再使用
|
java.lang.String |
getContentString(java.lang.String... mimeType)
支持Office2003(Word,Excel,PowerPoint,Visio)
支持Office2007(Word,Excel,PowerPoint,Visio)
如果需要解析Excel,需要传入mimeType参数
IFileParser.MIME_XLS:2003格式的Excel IFileParser.MIME_XLSX:2007格式的Excel |
java.lang.String |
getMetadata(java.lang.String metadataname) |
java.lang.String |
getTitle() |
void |
setFile(com.seeyon.ctp.common.file.model.CtpAbstractFile file) |
public java.io.Reader getContentReader()
getContentReader
在接口中 IFileParser
public java.lang.String getContentString(java.lang.String... mimeType)
file
- public java.lang.String getMetadata(java.lang.String metadataname)
getMetadata
在接口中 IFileParser
public java.lang.String getTitle()
getTitle
在接口中 IFileParser
public void setFile(com.seeyon.ctp.common.file.model.CtpAbstractFile file)
setFile
在接口中 IFileParser
public static java.lang.String docTextFilter(java.lang.String str)
str
- public java.lang.String getContentString()
getContentString
在接口中 IFileParser