2010-09-19 85 views
0

我想讀一個MS Word文檔和識別標題/粗體字/ Underscored字等?有沒有一種方法來編程解決這個問題?如果可能,我想在Java或PHP或Ruby中提出建議,否則如果有一些可用的元數據也讓我知道。MS Word識別標題/字體等?

+0

http://stackoverflow.com/questions/188452/reading-writing-a-ms-word-file-in-php – NAVEED 2010-09-19 05:47:32

回答

1

你有java API可以做到這一點。我建議你看看Apache POI庫。

+0

的Apache提卡的好項目,我發現它很多東西。 – realnumber 2010-09-19 18:44:00

1

這是關係到這個 What's a good Java API for creating Word documents?

有正在進行的API爲這一個使用Apache POI的工作。

HWPF是我們 Microsoft Word 97中(-2007)文件格式 的端口純Java的名字。它還提供有限的 只讀支持以前的Word 6 和Word 95文件格式和Word 95文件格式。

HWPF的新合作伙伴Word 2007 .docx格式爲XWPF。雖然HWPF 和XWPF提供了類似的功能,但 目前在它們兩個之間沒有通用的接口 。

http://poi.apache.org/hwpf/quick-guide.html