0
A
回答
2
首先,將PDF轉換爲HTML。見Converting PDF to HTML with Python。
然後,使用HTML解析庫解析從PDF生成的HTML。請參閱BeautifulSoup HTML table parsing
相關問題
- 1. 如何使用Scrapy保存PDF文件?
- 2. 使用Scrapy下載PDF文件
- 3. 使用Scrapy從網站上查找和下載PDF文件
- 4. PDF文件在IE8
- 5. 在PDF文件c#
- 6. FPDF:輸出pdf文件insted pdf文件
- 7. 對本地文件Scrapy殼
- 8. Scrapy ::傾銷JSON文件
- 9. Scrapy - 錯誤書面文件
- 10. Scrapy輸出JSON文件
- 11. Scrapy打印到json文件
- 12. scrapy返回空json文件
- 13. PDF庫在Android中呈現PDF文件
- 14. Scrapy正在下載文件錯誤
- 15. 在Scrapy中輸出空文件json
- 16. 在scrapy中選擇文件名
- 17. 在PDFBOX中創建PDF文件(從現有的pdf文件)
- 18. 在與angularjs相同的PDF文件夾中下載PDF文件
- 19. 在FOP生成的PDF文件中包含PDF文件
- 20. PDF文件下載在Vaadin
- 21. 在另一個.pdf文件
- 22. 正在下載pdf文件
- 23. 在Rmarkdown PDF文件和頭
- 24. pdf reader在線文件
- 25. ghostscript header在pdf文件
- 26. 寫在PDF文件閱讀
- 27. csv到PDF文件在java
- 28. 正在下載PDF文件
- 29. PDF文件
- 30. 爲PDF文件
您能解釋一下您正在嘗試做什麼嗎? – lindelof