2013-08-01 48 views
0

任何人都可以推薦用於處理文檔的python模塊。我需要的模塊可以替換文本中的任何變量(即$$ TITLE $$),而不會造成格式丟失。模塊需要Microsoft Word 2003/2007,OpenDocuments。用於文檔模板管理的python模塊

回答

0

還沒有嘗試過,但https://github.com/mikemaccana/python-docx似乎是你在找什麼。有一段時間沒有更新,但它是你正在尋找的舊版本的Word版本。

+0

不幸的是,然後我使用python-docx我失去了格式 –

0

據我所知,沒有一個單獨的python模塊可以一般地操作Microsoft和OpenOffice文檔格式。

也就是說,Microsoft Office和OpenOffice(可以)都使用XML來存儲他們的文檔。對於Office 2003,XML是可選的,但從2010年開始它是默認值。

所以,你可以按照兩種方法:

  1. 快速和骯髒的 使用XML工具包和XPath,選擇文檔中(XML)文本節點。在每個文本節點上運行您的替換例程。

  2. neat-but-slow 研究每種文檔類型的XML格式。使用XML工具箱和XPath,選擇將包含(文檔)文本的節點。在每個文本節點上運行替換例程。

我會從快速和骯髒開始,看看它有多遠。然後,如果您發現更改了您不想更改的節點,則可以添加專門的措施來防止基於研究XML格式的問題。

+0

我需要一個描述格式的模塊,而不是所有。 –

+0

啊,然後看看這裏:http://www.blog.pythonlibrary.org/2010/07/16/python-and-microsoft-office-using-pywin32/ –

+0

我在Linux下工作。 –