2012-12-02 91 views
4

我有一個PDF文檔的存儲庫,這些文檔中包含的大多數文本都使用Comic Sans格式化。我想將其改爲類似於Arial的內容。 原始字體嵌入在文檔中。我還沒有找到任何現有的工具爲我做(我在Linux上),我不知道是否有可能做到這一點programmaticaly。 Python庫是完美的,但任何編程語言的庫都可以。更改PDF中的字體

在哪個庫中,我可以用最少的努力來替換字體?我會使用哪些API部分?

+1

我沒有解決方案。但是您需要保持使用完全相同尺寸的字體。例如,如果它是一個更寬的字體,如果線條不夠長,它將不會形成新的線條,而是會延長到右邊(希望您瞭解儘管我對英語知識有限) –

+0

您是否嘗試過使用PDFedit它甚至具有一些刻劃功能(不知道thwy是否足夠用於此) –

+0

不僅個體寬度相同,而且如果使用字距調整,相同的字形對應該需要相同的字距。因此,從本質上講,取代字體會使事情看起來很難看,除非字體被設計爲可以互相替換。 – mkl

回答

1

有商業工具可以做到這一點 - 其中之一是從卡拉斯軟件pdfToolbox(警告 - 我在這家公司下屬)

但是 - 即使這個功能存在並且有時被使用 - 結果往往是完全不受歡迎的,而且我還沒有看到很多情況下它被用於非常特定的文件。並且通常取得有限的成功。到了這個替換隻能在我提到的工具中作爲手動操作使用的時候 - 而不是在自動模式下。

根據這些文件的複雜程度,您可能會更好地將所有文本從文檔中提取到類似RTF的文件中,執行您所需的任何操作並在此之後重新生成PDF。聽起來像一個迂迴的方式,但我猜測結果會在大多數情況下更好...

+1

這就是我反對PDF等預分類電子文檔的關鍵所在。

+1

;)@PeterWone主要是爲了不恰當的使用這樣的文件。而對於那些丟棄源代碼的人來說,這些PDF文件是從......中產生的。現有的PDF文件內容並不是要改變的,它們是要重新生成的。 – mkl

+2

@PeterWone:與需要維護電子文檔庫的人(無論是出於藝術原因還是合法的)進行交談,並且必須確保這些文檔在任何情況下絕對不會改變......或者對於設計人員一幅將要在世界三個地方印刷的作品,並且必須確保所有五百萬張印刷品看起來完全一樣。這就是PDF意味着什麼,擅長什麼。編輯一個PDF文件可以完成,但 - 坦率地說,這是文件格式的畸變...... –