我正在編寫一個程序,需要以文檔的形式輸入,它需要替換幾個值,插入一個表格並將其轉換爲PDF。它是用Python + Qt(PyQt)編寫的。是否有任何可以通過編程方式輕鬆使用的衆所周知的文檔標準?它必須是跨平臺的,最好是開放的。以編程方式使用什麼是好的文檔標準?
我查看了Microsoft Doc和Docx,它們是二進制格式,我無法編輯它們。 Python已經綁定了它,但它們只在Windows上。
Open Office的ODT/ODF壓縮在xml文件中,所以我可以編輯該文件,但沒有命令行實用程序或以編程方式將文件轉換爲PDF的任何方式。 Open Office提供綁定,但您需要從命令行運行Open Office,啓動服務器等。而我的客戶端可能沒有安裝Open Office。
RTF可以從Python讀取,但我找不到任何方式/庫將RTF文檔轉換爲PDF。
目前我正在從Microsoft Word導出到HTML,替換值並使用PyQt將其轉換爲PDF。但是它失去了格式化功能,看起來很糟糕。我很驚訝沒有一個衆所周知的庫可以讓你編輯各種文檔格式並將它們轉換成其他格式,我錯過了什麼?
更新:感謝您的建議,我會看看使用乳膠。
感謝, 傑克遜
之所以沒有一個知名的庫來做這些轉換,是因爲這些文檔格式都很複雜。 OpenOffice可能是最接近轉換器的。 (順便說一句,OpenOffice遠不是唯一可以打開ODT/ODF文件的程序 - 該格式旨在成爲所有文字處理器可以讀寫的標準。) – 2010-06-21 06:30:39