403在Python中使用urllib2打開網頁時出現「訪問被拒絕」錯誤

我試圖通過打開此URL，https://www.google.com/search?q=define+<something>並解析定義的源代碼來使用Google和urllib2來獲取單詞的定義。但是，當我嘗試訪問該頁面時，我得到一個403錯誤，據說是爲了防止這種類型的數據挖掘。我相當肯定，嘗試繞過它並不明智，所以我想知道是否有替代方法可以從Google服務器訪問數據，或者我應該使用數據轉儲。403在Python中使用urllib2打開網頁時出現「訪問被拒絕」錯誤

編輯：這裏是我用來訪問URL的代碼的程度;

url = "https://www.google.com/search?q=define+" + word 
try: 
    source = ulib.urlopen(url) 
except ulib.HTTPError, e: 
    print e.fp.read()

來源

2014-03-04 Maurdekye

我們需要檢查您正在使用的代碼，以便查看發生了什麼問題。對具有特定網址的Chrome進行的測試可以訪問。 – sabbahillel

我們需要看到您的驗證碼，但您的問題可能回答here。簡而言之，您需要定義您的用戶代理。

來源

2014-03-04 16:54:54

403在Python中使用urllib2打開網頁時出現「訪問被拒絕」錯誤

回答

相關問題