2016-10-04 52 views
-1

我正在嘗試使用Python來讀取HTML中的一個URL的內容。要獲取URLHTML內容,我是否會完全使用模塊wgeturllib或其他模塊?在Python中從URL中獲取HTML

之後回答: 我將使用urllib模塊,因爲它帶有默認的Python 2.7版本,我無法從此計算機下載外部模塊。模塊的

列表,取指URL內容:

Wget 
Beautiful Soup 
Urllib 
Requests 
+0

您是否嘗試過'BeautifulSoup'? –

+0

是的。有多種選擇(向列表中添加請求),您可以使用其中的任何選項。 – tdelaney

+0

你能告訴我們你試過了什麼嗎?本網站上有很多關於此主題的問題和解答。你有具體的問題嗎? – MooingRawr

回答

2

這裏是一個樣本,讓你開始用requests

import requests 

resp = requests.get('http://httpbin.org/get') 
if resp.ok: 
    print (resp.text) 
else: 
    print ("Boo! {}".format(resp.status_code)) 
    print (resp.text) 
+0

這是最簡單的。如果您使用的是Python3.x,請將'print resp.text'替換爲'print(resp.text)'。 –

+0

除此之外:http://httpbin.org是用於測試客戶端的極好資源。 –

+0

謝謝,@ 345243lkj - 我修正了樣本和評論。 –