你好我試圖讀取DOC和DOCX文件中的文本.doc文件,對DOC文件我這樣做的Java讀取使用POI
package test;
import java.io.File;
import java.io.FileInputStream;
import org.apache.poi.hwpf.HWPFDocument;
import org.apache.poi.hwpf.extractor.WordExtractor;
public class ReadFile {
public static void main(String[] args) {
File file = null;
WordExtractor extractor = null;
try {
file = new File("C:\\Users\\rijo\\Downloads\\r.doc");
FileInputStream fis = new FileInputStream(file.getAbsolutePath());
HWPFDocument document = new HWPFDocument(fis);
extractor = new WordExtractor(document);
String fileData = extractor.getText();
System.out.println(fileData);
} catch (Exception exep) {
}
}
}
但是這給了我一個org/apache/poi/OldFileFormatException
例外。
任何想法如何解決這個問題?
此外我需要閱讀Docx和PDF文件?任何好的方法來讀取所有類型的文件?
您使用的是哪個版本的POI? – Paolo