現在我正在用Perlscript生成HTML,然後在OpenOffice中手動轉換爲DOC。其實我必須複製,創建新的「文本文檔」,粘貼,保存,因爲它將HTML和DOC視爲單獨的文件類型,但這非常不重要。這非常不方便。什麼是生成DOC文件的最簡單方法?
有任何自動化的方式,我可以HTML轉換成DOC得體,或者其它的一些格式,如HTML,我可以以文本方式產生,並轉換爲DOC以自動化的方式?
(我在OSX)
現在我正在用Perlscript生成HTML,然後在OpenOffice中手動轉換爲DOC。其實我必須複製,創建新的「文本文檔」,粘貼,保存,因爲它將HTML和DOC視爲單獨的文件類型,但這非常不重要。這非常不方便。什麼是生成DOC文件的最簡單方法?
有任何自動化的方式,我可以HTML轉換成DOC得體,或者其它的一些格式,如HTML,我可以以文本方式產生,並轉換爲DOC以自動化的方式?
(我在OSX)
我不能幫助你爲.doc,不過你沒看到微軟的Open XML Format SDK?這將允許您從.NET代碼生成Office 2007格式文檔(.docx,.xlsx等)。
理論上你可能有一些運氣這單下在OS X上,因爲它並不需要Office 2007(適用於Windows)的安裝工作。
不知道這是你想要的,但你可以很容易地用代碼生成WordML文檔。 WordML是Word 2003 XML文件格式。這與Office 2007 Open XML格式不同。如果你只是做了基本的格式化,WordML只是一個不難創建的文件。您可以直接生成它,而不是首先創建HTML。您可以使用.DOC擴展名命名這些文件,並且Word 2003及更高版本將會打開它們。如果需要,您可以將它們重新保存爲真正的.DOC文件。
這裏是在線的WordML參考。如果您願意,我可以寄給您一些示例代碼。 http://msdn.microsoft.com/en-us/library/aa212812(office.11).aspx
如果您確實想要創建可以轉換爲其他格式的通用文件格式,那麼創建XML-FO文件可能是一種可行的方法。有許多產品可以將XML-FO轉換爲其他文件,如Word和PDF。
我們使用了可用於.NET和Java的Aspose的組件。使用Java,你也可以在OS X上使用它們。
您需要購買的組件(即它們不是免費的),但除了這一點,他們真的很棒。
爲了兼容性,我需要DOC,而不是DOCX(我個人寧願只使用HTML,但這是我們生活的世界)。 糾正我,如果我錯了,但如果我理解正確,這個SDK並沒有真正解決我的問題,只是取代容易生成HTML(或XML)的問題與C#API做相同的難題,米仍然沒有接近我曾經以前的DOC。 (除非docx對於正常腳本來說太難以生成,並且SDK做一些非定向的操作)。 – taw 2009-10-12 11:38:34
那麼,如果你嚴格需要.doc,並且沒有辦法強制你的客戶端接受.docx,那麼這不是你的解決方案,正如我所說的。 SDK有一個工具,您可以將現有文檔提供給它,並且它將生成從scratch_生成該文檔所需的C#。 docx世代確實比.doc更容易,但確實還是不平凡的。 – tomfanning 2009-10-12 12:14:12