是否有用於閱讀Word文檔(包括.docx和舊的.doc格式)的開源Java庫?閱讀Word文檔的Java庫
只讀訪問,如果足夠;我不需要使用Java修改Word文檔。但是,我想要訪問圖像和樣式信息。
編輯
我已經簽出的Apache POI,但它並不像它正在積極維護。見http://poi.apache.org/hwpf/index.html:
目前我們不幸沒有人照顧HWPF和促進其發展。
是否有用於閱讀Word文檔(包括.docx和舊的.doc格式)的開源Java庫?閱讀Word文檔的Java庫
只讀訪問,如果足夠;我不需要使用Java修改Word文檔。但是,我想要訪問圖像和樣式信息。
編輯
我已經簽出的Apache POI,但它並不像它正在積極維護。見http://poi.apache.org/hwpf/index.html:
目前我們不幸沒有人照顧HWPF和促進其發展。
有一個Apache項目,這是否:http://poi.apache.org//
public class XParseTest
{
public static void main(String[] args) throws XmlException, OpenXML4JException, IOException
{
File file=new File("e:\\testing\\new.docx");
FileInputStream fs = new FileInputStream(file);
OPCPackage d = OPCPackage.open(fs);
XWPFWordExtractor xw = new XWPFWordExtractor(d);
System.out.println(xw.getText());
}
}
這將解析的docx文件...
'HTTP :// poi.apache.org /' – darioo