2014-01-07 58 views
5

我使用PhantomJS將許多(+500)網頁轉換爲PDF文檔。問題是,對於相對較小的頁面,我一直收到相當大的PDF文件(大約900 kb) - 帶圖像的70 kb。他們爲什麼這麼大? Firefox中的一個簡單的「保存爲PDF」文件會創建一個200 kb的文件,這很好。我很快就要處理許多其他頁面,文件大小可能會成爲問題。任何建議?PhantomJS生成大型PDF

編輯:這裏有兩個樣本:輸出PhantomJSFirefox save to PDF

+2

如果可能,請使用專業工具(如Acrobat Pro)來審覈您的PDF - 它會告訴您所有字節的位置。如果沒有,發佈一個鏈接到在線樣本。問題出在PhantomJS本身 - 即無法儘可能緊湊地壓縮,不能對字體進行子集化等等。 – usr2564301

+0

我同意Jongware,使用一些PDF工具來找出問題。我敢打賭,phantomjs不會做任何壓縮。 – JasonS

回答

2

即使我面臨同樣的問題。當數據量很大時,我試圖減小pdf的大小。我觀察到的是,如果您在任何這些標頭標籤(h1,h2 ... h6)內轉儲了您的文本內容(示例段落,表格數據,描述等),則這部分內容將呈現爲PDF格式,而不是圖像。這將減少大量的PDF文件大小。

我不確定爲什麼div,p,span標籤中的內容不被視爲文本,而是作爲pdf中的圖像處理。