2014-02-17 74 views
2

我正在使用DOCX庫來操作* .docx文件。可以使用DOCX Library將DOCX文件保存爲HTML嗎?

我想保存的docx *文件作爲一個HTML文件,但是這個代碼:

using (DocX sourceDoc = DocX.Create(sourceFilename)) 
{ 
    sourceDoc.SaveAs(sourceHTMLFileName); 
} 

...不起作用(sourceHTMLFileName是 「Bla.html」)。

可能嗎?如果是這樣,怎麼樣?

回答

2

DocX的作者在blog post中表示他的庫尚不支持此功能。我從codeplex page爲圖書館的鏈接)從鏈路

報價:

我很想加入這個功能,DOCX,但是有一個問題。

[...]

唯一的簡單的方法來做到這一點的轉換,是使用微軟的Office互操作庫

[...]

有沒有辦法做轉換,而不在我的機器上安裝了Word.exe。我沒有這麼說,我說沒有簡單的方法。 This看起來很有希望,現在如果我只能找到時間。

他建議使用Interop的解決方法,但根據您的環境可能無法實現。

使用SaveAs.html結尾的文件只是保存.docx文件,其擴展名錯誤;沒有轉換完成。

+0

「將SaveAs與以.html結尾的文件一起使用只會保存具有錯誤擴展名的.docx文件;沒有轉換完成。」 是的,我注意到了。 –

+0

我認爲你必須使用你自己的實現從word中讀取數據並轉換爲html。 'MagicText'具有'FormattedText'屬性,您可以在其中獲取文本的樣式信息,但無法獲取位置。 更好使用'OpenXml'庫並使用'HtmlConverter'類 – xwpdev