2016-03-21 47 views
-1

我想從網站獲取信息。這是它的簡單代碼。python 3.X urllib.request http錯誤416

import urllib.request 
response = urllib.request.urlopen('http://www.lamudi.com.ph/buy/?page=1&size=30') 
html = response.read() 

我得到一個urllib.error.HTTPError: HTTP Error 416: Requested Range Not Satisfiable

回答

1

這個特定的網站不希望機器人閱讀的內容。 urllib.request.urlopen的問題在於它引發了4xx或5xx返回代碼的異常,使得難以看到來自服務器的實際響應。一個更好的圖書館是requests

如果你得到的迴應,你會看到:

在您瀏覽的http:// ......講講你的瀏覽器讓我們覺得你是一個機器人。

你必須和他們確認,如果你可以使用他們的信息,但如果這是你的個人使用,您可以嘗試改變用戶代理,以一個由你的瀏覽器使用。

+0

感謝您的快速響應。我會看看請求模塊,並與他們查詢信息。 – sndrosilva