那麼我最近問了一個關於讓PDF文件成爲XML文件然後將其返回到PDF文件的問題,最好與原文完全一樣,但至少差不多一樣。PDF到XML並再次回到PDF
我一直在嘗試不同的方法,到目前爲止我想出了這一個。
- 用LibreOffice編寫的文檔被保存爲DocBook XML。說它被命名爲「file.xml」。
- 該文件使用文件「docbook.xsl」啓動的DocBook項目中的一組XSL模板進行分析。
- 這被通過運行來完成:在xsltproc -o intermediate-fo-file.fo /usr/share/xml/docbook/stylesheet/nwalsh/fo/docbook.xsl file.xml
- 結果是中間XSL-通過運行成爲PDF的FO:fop intermediate-fo-file.fo final.pdf
- 該PDF文件看起來與原始ODT文件幾乎相同。
但還是說,我在開始時有一個PDF文件,怎麼可能做同樣的事情呢?有什麼建議麼?
謝謝您的回答。逐漸地,我逐漸明白了完成這項任務的難度,但仍然考慮到XML所需的空間比例與PDF中顯示的相同信息相比所帶來的巨大收益。在某些情況下,它是十倍 - XML = 10kb PDF = 1Mb在我們處理大量文檔的巨大長期存檔系統中,如果文件可以以XML格式存儲,但以PDF格式存儲,則會產生影響 - 考慮到公司和當局最初在PDF中產生了大量的文件。 –
這就是爲什麼PDF-XML-PDF會「膨脹」來解決。 –
@Paul如果你的pdf文檔很簡單我相當肯定你可以做你最初的問題。另外,你有沒有看過PDF/A(PDF存檔)? – Jimmy