2014-03-04 15 views
0

我試圖通過打開此URL,https://www.google.com/search?q=define+<something>並解析定義的源代碼來使用Google和urllib2來獲取單詞的定義。但是,當我嘗試訪問該頁面時,我得到一個403錯誤,據說是爲了防止這種類型的數據挖掘。我相當肯定,嘗試繞過它並不明智,所以我想知道是否有替代方法可以從Google服務器訪問數據,或者我應該使用數據轉儲。403在Python中使用urllib2打開網頁時出現「訪問被拒絕」錯誤

編輯:這裏是我用來訪問URL的代碼的程度;

url = "https://www.google.com/search?q=define+" + word 
try: 
    source = ulib.urlopen(url) 
except ulib.HTTPError, e: 
    print e.fp.read() 
+0

我們需要檢查您正在使用的代碼,以便查看發生了什麼問題。對具有特定網址的Chrome進行的測試可以訪問。 – sabbahillel

回答

1

我們需要看到您的驗證碼,但您的問題可能回答here。簡而言之,您需要定義您的用戶代理。

相關問題