2016-08-03 43 views
0

幾周前,我們的用戶指出一些大型OCR PDF(ABBYY生成的)加載非常緩慢,並要求我們對其進行一些優化。PDF優化:pdftops -passfonts - 它是如何使PDF加載方式更快?

經過一番調查後,問題似乎是由嵌入在PDF中的複雜文本造成的。我嘗試了不同的腳本來優化PDF文件,如ghostscript,qpdf等...

我發現的唯一一個做了顯着改進的是使用pdftops(來自poppler)和-passfonts選項並將其轉換回來使用ghostscript ps2pdf進行PDF:pdftops -passfonts intput.pdf output.ps & & ps2pdf output.ps output.pdf。

然而,問題是我不知道-passfonts如何使PDF加載速度較快,無論是做一個副作用,我不知道......

所以可以將PDF大師闡明一些燈光這種優化背後的原因/邏輯?

謝謝大家! 傑弗裏

+0

你可以分享示例文件和街道優化之前? – mkl

回答

0

http://linux.die.net/man/1/pdftops

-passfonts

默認情況下,在PDF文件非嵌入式的8位字體引用替換爲最近的 「黑體」,「時間─羅馬「或」Courier「字體。此選項通過對PostScript文件

當文件打開時,讀者會看系統的非嵌入字體,並且當它發現他們加載它們傳遞給非嵌入字體引用。這些非嵌入式字體越多,它所做的檢查就越多。某些時候,由於法律原因,字體沒有嵌入,有時它們並沒有嵌入,因爲它們使文件大小不成比例以及其他各種原因。通過使用更常見的字體代替非嵌入字體,我會說你迫使PDF加載較少數量的字體,並且可能迫使PDF使用具有較小存儲器尺寸的字體導致更快的加載時間。

比較前後的字體列表。也許這將會帶來更多的光明。 如果您在使用Adobe Acrobat打開文檔: 文件 - >屬性 - >字體

要與字體替換謹慎!它可能會完全毀掉文檔的外觀和感覺。