回答
有PDFMiner任何迴應。它也有一個Python-API。這可以幫助您搜索圖像。通過使用:
from pdfminer.layout import LAParams
from pdfminer.converter import PDFPageAggregator
# Set parameters for analysis.
laparams = LAParams()
# Create a PDF page aggregator object.
device = PDFPageAggregator(rsrcmgr, laparams=laparams)
interpreter = PDFPageInterpreter(rsrcmgr, device)
for page in doc.get_pages():
interpreter.process_page(page)
# receive the LTPage object for the page.
layout = device.get_result()
layout
是LTPage
-object,這基本上是一個頁面上的所有佈局對象的樹。你可以沿着這棵樹的所有分支走,並檢查某個地方是否有一個LTImage
對象 - 然後你就知道有一個圖像。
PDFMiner只適用於Python 2.x.
非常感謝你@Thorsten ..我會嘗試這個 – user1839132
歡迎你,讓我知道你是否成功。 –
pdfminer有一個很好的「彙總」能夠循環這些不同的LTImage/LTPage對象:http://denis.papathanasiou.org/2010/08/04/extracting-text-images-from-pdf-files/ –
- 1. 自動檢測來自PDF的圖像
- 2. 在Python中檢測像素化圖像
- 3. 檢測圖像
- 4. python檢測文檔中的圖像
- 5. 使用Python的圖像顏色檢測
- 6. Python中的圖像點檢測
- 7. Python:解析PDF和圖像
- 8. 如何從PDF中檢測顏色Python
- 9. 塊圖像檢測
- 10. 使用PIL(Python圖像庫)來檢測屏幕上的圖像
- 11. Python大圖像邊緣檢測使用Scikit圖像和GDAL
- 12. 如何檢測pdf是文本還是圖像
- 13. 圖像內部的圖像檢測
- 14. PDF流血檢測
- 15. 使用python檢測圖像的大小使用python
- 16. 圖像特徵檢測
- 17. 檢測圖像捕獲
- 18. 檢測RichTextBox中的圖像
- 19. OpenCV檢測圖像邊界
- 20. JFrame圖像碰撞檢測
- 21. 檢測圖像分辨率?
- 22. 檢測並從圖像
- 23. 多圖像碰撞檢測
- 24. 通用硒檢測圖像
- 25. 圖像的文本檢測
- 26. 實時圖像檢測
- 27. 檢測點擊圖像類
- 28. 檢測圖像的結尾
- 29. php圖像類型檢測
- 30. 檢測圖像加載
只是澄清,提問者的問題不是太糟糕:他想要一些示例代碼來使用python來提取PDF文件的圖像內容(如果存在)。所提供的答案確實可以回答這個問題。 –