2013-01-23 98 views
0

如何檢測PDF文件中的圖像(Python)。Python圖像檢測PDF

我必須檢測該圖像是否存在於PDF文件中。 有沒有辦法做到這一點。

我已經嘗試過PyPdf,但沒有成功。請幫我

感謝 讚賞

+0

只是澄清,提問者的問題不是太糟糕:他想要一些示例代碼來使用python來提取PDF文件的圖像內容(如果存在)。所提供的答案確實可以回答這個問題。 –

回答

1

有PDFMiner任何迴應。它也有一個Python-API。這可以幫助您搜索圖像。通過使用:

from pdfminer.layout import LAParams 
from pdfminer.converter import PDFPageAggregator 

# Set parameters for analysis. 
laparams = LAParams() 
# Create a PDF page aggregator object. 
device = PDFPageAggregator(rsrcmgr, laparams=laparams) 
interpreter = PDFPageInterpreter(rsrcmgr, device) 
for page in doc.get_pages(): 
    interpreter.process_page(page) 
    # receive the LTPage object for the page. 
    layout = device.get_result() 

layoutLTPage -object,這基本上是一個頁面上的所有佈局對象的樹。你可以沿着這棵樹的所有分支走,並檢查某個地方是否有一個LTImage對象 - 然後你就知道有一個圖像。

PDFMiner只適用於Python 2.x.

+0

非常感謝你@Thorsten ..我會嘗試這個 – user1839132

+0

歡迎你,讓我知道你是否成功。 –

+0

pdfminer有一個很好的「彙總」能夠循環這些不同的LTImage/LTPage對象:http://denis.papathanasiou.org/2010/08/04/extracting-text-images-from-pdf-files/ –