2016-08-22 11 views
-1

我的問題是在工作中我必須點擊一個網站的鏈接,然後將公司名稱,公司電話號碼和公司地址複製到Excel電子表格中,每個一個不同的列。這些信息位於每個網站上的相同位置,而且耗時很長,因爲我必須點擊每個鏈接,然後複製並粘貼信息。最有效的方法來編譯不同網站的大量信息

我掌握了Python編程語言的知識,我只是想知道是否最好的方法是使用該語言來搜索網站的源代碼,只留下相關信息或者如果使用其他編程語言。此外,有關圖書館的任何建議可以閱讀以獲得指導?

回答

1

您可以使用BeautifulSoup與requests/urllib結合使用來刮擦和解析網站的源代碼。

然後,您可以使用Openpyxl將數據寫入Excel電子表格。

+0

非常感謝!我現在就來看看! :D –

+0

如果您需要任何幫助,請隨時回覆,我會盡快回復您! – Harrison

+0

謝謝,感謝!我打算在接下來的幾天裏去看看,我相信你會聽到我的:) –

0

我之前使用過美麗的湯羹Python庫進行這類工作。它以一種方式組織所有HTML代碼,您可以輕鬆地從中提取所需的任何數據。你可以在這裏看到一個例子:https://www.crummy.com/software/BeautifulSoup/bs4/doc/

+0

似乎無法達到該鏈接:/你確定它的權利? –

+0

我只是再次點擊它,我能夠看到它。您也可以搜索「美麗的湯文檔」 – JMA

相關問題