2013-01-24 102 views
0

我需要從多個頁面獲取數據。數據存儲在html表格中。 我想生成SQL文件,將它們保存到我的數據庫。 我的目標之一是these results從html表中獲取數據

處理網站最簡單的方法可能是JavaScript,但是如何在每個網站上運行腳本並將結果寫入我的硬盤?

我也可以使用wget下載所有需要的站點,並用Python處理它們,如果它有必要的庫可以使用html。

回答

1

如果我正確理解你基本上必須從網上刮取一些內容並將其存儲在數據庫中。

我可能會去尋找一個Python腳本,它通過使用urllib2庫來抓取網頁,然後根據需要的內容(regexp,BeautifulSoup等等)以某種方式解析它。

看看這個問題:Web scraping with Python

+0

似乎合法,我會試試:) –