Q

scrapy在PDF文件

2012-06-07 58 views 0 likes

0

我在網上刮使用pythonscrapy在PDF文件

在PDF文件表工作表中的內容有一個人建議我這取的，才需要表我已經試過pypdf，PDF2HTML良好的模塊，OCR，石板但沒有任何工程

感謝

2012-06-07 user1369478

+0

您能解釋一下您正在嘗試做什麼嗎？ – lindelof

A

回答

2

首先，將PDF轉換爲HTML。見Converting PDF to HTML with Python。

然後，使用HTML解析庫解析從PDF生成的HTML。請參閱BeautifulSoup HTML table parsing

2012-06-07 06:41:26

相關問題