2013-02-13 86 views
0

按我的理解,pdfbox可以提取矢量圖像嗎?

1. .eps format images are vector images. 
2. When we draw something in word (like a flowchart) that is stored 
as a vector image. 

我幾乎可以肯定,第一,不知道第二。如果我錯了,請糾正我。

假設這兩件事情,當一個乳膠文件(其中.eps圖像被插入)或一個文件(包含矢量圖像)被轉換爲PDF格式,圖像被轉換成光柵圖像?

此外,我認爲PDFBox/xpdf只能從pdf中提取光柵圖像(因爲它們嵌入爲XObjects),而不是矢量圖像。這種理解是否正確? This question在stackoverflow是相關的,但尚未得到答覆。

回答

3

您的觀點1不正確,eps文件是PostScript程序,它們可能包含矢量信息,或者文本或圖像數據,或者全部上述內容。

point 2在PDF中沒有「矢量圖像」,圖像意味着位圖,因此不能是矢量。

如果您將PostScript程序轉換爲PDF文件,則結果完全取決於您使用的轉換程序。通常,矢量將保留爲矢量,文本用作文本。然而,應用程序完全可能呈現整個PostScript程序並將結果作爲圖像插入到PDF中。

因此,對於第一個問題(「將圖像轉換爲光柵圖像」)的答案是'可能,但可能不是'。

我怕我不知道PDFBox的/ xpdf中的能力的想法,但由於載體的集合,也可以不設置爲「圖像」(他們可以將舉行形式XObject的,或圖案)在任何原子時尚,沒有任何明顯的方法知道何時停止提取。無論如何,你會以什麼格式存儲結果?

+0

感謝您的回答。我的第一個問題得到了答案,但由於我沒有得到第二個問題的答案,所以我通過不接受它而保持開放。順便說一句,有沒有辦法知道我們是否有一個PDF格式的矢量圖像? Inkscape可以做到這一點,但我需要一個批處理軟件,如PDFBox/xpdf。 – rivu 2013-02-13 18:08:41

+1

我們開始迅速解決這些問題的定義問題。如果頁面是空白的,它是否包含矢量繪圖操作(不是圖像,請具備完全不同的含義)。現在如果我在上面畫一個白色的矩形,那麼怎麼樣?如果我畫一個彩色矩形,但是在媒體框外面,或者在媒體框內但在裁剪框外面怎麼樣?我不會接受我的答案,因爲它只能真正解決您的一半問題。你需要考慮你想用矢量繪圖操作來做什麼,在提取之後你想如何存儲它們。 – KenS 2013-02-14 08:22:17