2011-03-23 71 views
6

我想將html或xhtml文檔(最好帶有樣式)轉換爲Microsoft .doc和/或.docx格式。將html轉換爲java中的doc

似乎有很多這樣做的另一種方式的例子,但我還沒有找到任何有用的例子轉換爲MS文檔格式。

任何人都可以點我的API或這樣做,請

非常感謝

+0

你想有一個實際的.doc文件或可與詞來打開和/或修改/打印的文件? – 2011-03-23 09:58:02

+0

實際文檔或docx。看起來創建docx可能更容易,但doc會提供更好的向後兼容性 – Edd 2011-03-23 10:06:30

+0

開放/ libre辦公室可能會做些什麼 – vickirk 2011-03-23 10:30:45

回答

2

docx4j 2.8.0支持轉換的XHTML文檔和片段DOCX內容。披露:我寫了一些代碼。

+0

你能提供更多的信息.​​..我非常想知道如何做到這一點 – Edd 2012-05-29 12:02:46

+0

博客文章http://www.docx4java .org/blog/2012/05/docx4j-2-8-0-released /包含示例代碼的鏈接。 – JasonPlutext 2012-05-29 21:46:25

0

爲了與你可能不得不採取在Apache's POI Library從深層次看微軟的文檔工作提供一個例子。

不過,使用(X)HTML樣式創建.doc文件需要一些努力。

+0

確實,Apache POI幾乎是唯一的調用端口。它不會進行轉換(這非常非常不重要),但它確實允許您創建.doc文檔。 – AndyT 2011-03-23 10:13:38

+0

我追求的是真正爲我做驢工作的東西。一些將解析和xhtml文檔並輸出文檔或docx文檔 – Edd 2011-03-23 10:14:45

0

我已經花了一點時間看着docx4j。它似乎爲從docx創建html文檔提供了很好的方法,但我無法看到其他任何方式。

目前這仍然看起來像最簡單的方法,因爲它只是使用jaxb對象(我認爲)。

+0

我已經將docx4j的HTML(而不是任何舊的HTML位)轉換回docx。因此,docx4j中有一些小東西可以幫助您:像org.docx4j.model.properties.run.Bold這樣的類具有帶CSSValue的構造函數。其他位不存在(例如,使用它的代碼,轉換HTML表的代碼以及導入圖像的代碼)。 – JasonPlutext 2011-03-24 09:38:01

1

又一解決方案是使用jodconverter這似乎是基本的HTML文檔來轉換...它不主張把它做好,雖然

+0

您是否找到任何將doc和docx轉換爲html的內容?如果有的話,請告訴我示例代碼? – user960567 2012-01-28 17:13:27

+0

我還沒有能夠承諾,但我恐怕 – Edd 2012-01-30 10:29:40

0

我試過docjx4j API 2.8.1,它的工作原理就像是奇蹟。它有ConvertinXHTMLinFile,它工作正常。如果有人想要的代碼,我會發布它。

這裏是一個幫助過我的鏈接:ConvertInXHTMLFile