我正在嘗試使用Python
來讀取HTML
中的一個URL
的內容。要獲取URL
的HTML
內容,我是否會完全使用模塊wget
,urllib
或其他模塊?在Python中從URL中獲取HTML
之後回答: 我將使用urllib
模塊,因爲它帶有默認的Python 2.7版本,我無法從此計算機下載外部模塊。模塊的
列表,取指URL內容:
Wget
Beautiful Soup
Urllib
Requests
我正在嘗試使用Python
來讀取HTML
中的一個URL
的內容。要獲取URL
的HTML
內容,我是否會完全使用模塊wget
,urllib
或其他模塊?在Python中從URL中獲取HTML
之後回答: 我將使用urllib
模塊,因爲它帶有默認的Python 2.7版本,我無法從此計算機下載外部模塊。模塊的
列表,取指URL內容:
Wget
Beautiful Soup
Urllib
Requests
這裏是一個樣本,讓你開始用requests
:
import requests
resp = requests.get('http://httpbin.org/get')
if resp.ok:
print (resp.text)
else:
print ("Boo! {}".format(resp.status_code))
print (resp.text)
這是最簡單的。如果您使用的是Python3.x,請將'print resp.text'替換爲'print(resp.text)'。 –
除此之外:http://httpbin.org是用於測試客戶端的極好資源。 –
謝謝,@ 345243lkj - 我修正了樣本和評論。 –
您是否嘗試過'BeautifulSoup'? –
是的。有多種選擇(向列表中添加請求),您可以使用其中的任何選項。 – tdelaney
你能告訴我們你試過了什麼嗎?本網站上有很多關於此主題的問題和解答。你有具體的問題嗎? – MooingRawr