2017-04-05 55 views
0

我想從網站基URL獲取所有鏈接/ html頁面。我閱讀文檔,並知道它可以使用python Beautifulsoup組合來實現。您可以讓我知道如何安裝BeautifulSoup和任何其他先決條件的步驟。 一旦安裝了BeautifulSoup,我如何在Python代碼中使用它。如果有人可以共享python代碼來實現這一點。beautifulsoup用於從網站中的基本URL獲取所有鏈接

+0

看看:[用Python扒網頁](http://stackoverflow.com/documentation/python/1792/web-scraping-with-python#t=201704051114226410689) –

回答

0

您的問題沒有提供您的操作系統或特定目標的信息。我假設你已經安裝了Python。 pip是管理python包的命令行工具。您可以在終端上運行下面的命令

pip install beautifulsoup4 

beautifulsoup documentation就是要學習更多的開始的好地方。

+0

Python已經安裝,Python 2.7版本0.8。我正在嘗試通過cmd安裝everythng。當我運行命令pip安裝beautifulsoup時,它說'pip'不被識別爲內部或外部命令, – Nisha

0

question中的片段可能會幫助您檢索基本網址中的所有鏈接。

+0

感謝此..在運行此之前,我感覺很漂亮需要sip和pip。我在安裝時遇到問題。將首先要求更多細節。 – Nisha

+0

如果您的操作系統是windows,只需下載包含pip作爲捆綁模塊的python 3.6。然後將你的python 3.6和python 3.6/scripts添加到你的環境路徑中。然後你可以在命令提示符下使用pip install beautifulsoup4。 – pythonlearn

相關問題