2013-04-30 27 views
4

我在無頭模式下使用libreoffice將HTML轉換爲各種格式。對於這個問題,爲簡單起見,我們將使用docx。使用libreoffice從HTML轉換時嵌入圖像

我用類似這樣的命令:

libreoffice --headless --convert-to docx:"MS Word 2007 XML" --writer document.html 

這個偉大的工程大部分。

該HTML包含幾個圖像的絕對鏈接。

<img src="http://myserver.com/image1.jpg" /> 

當文檔轉換爲document.docx時,圖像仍然被鏈接到,而不是嵌入到文檔中。這會導致您在離線狀態下以及在預覽等情況下出現問題。

有沒有一種方法可以告訴libreoffice直接將圖像下載並嵌入到文檔中,而不是將它們保留爲鏈接圖像?

+0

我有相反的問題。最新版本似乎默認嵌入,但我希望它創建實際的文件。 – 2014-11-06 21:42:59

回答

-1

轉換爲odt安裝pandoc後很容易。

經過比較困難的部分:從odt(甚至html)開始,您可以通過例如腳本(Open | Libre) unoconv

或者你可以像:

的AbiWord --to = DOC filename.odt 也看到這個線程,這篇博客文章。 安裝pandoc後,轉換爲odt非常簡單。

經過比較困難的部分:從odt(甚至html)開始,您可以通過例如腳本(Open | Libre) unoconv

或者你可以像:

的AbiWord --to = DOC filename.odt 也看到這個線程,這篇博客文章。