2011-10-11 81 views
1

是否有用於閱讀Word文檔(包括.docx和舊的.doc格式)的開源Java庫?閱讀Word文檔的Java庫

只讀訪問,如果足夠;我不需要使用Java修改Word文檔。但是,我想要訪問圖像和樣式信息。

編輯

我已經簽出的Apache POI,但它並不像它正在積極維護。見http://poi.apache.org/hwpf/index.html

目前我們不幸沒有人照顧HWPF和促進其發展。

+0

'HTTP :// poi.apache.org /' – darioo

回答

6

Apache POI HWPF爲.doc和XWPF爲的.docx文件

+0

謝謝,我已經檢查過POI,但它看起來並不像它正在積極維護... –

0
public class XParseTest 
{ 
    public static void main(String[] args) throws XmlException, OpenXML4JException, IOException 
    { 
     File file=new File("e:\\testing\\new.docx"); 
     FileInputStream fs = new FileInputStream(file); 
     OPCPackage d = OPCPackage.open(fs); 
     XWPFWordExtractor xw = new XWPFWordExtractor(d); 
     System.out.println(xw.getText());  

    } 

} 

這將解析的docx文件...