2011-05-30 129 views
0

我正在研究一個項目,我需要從Google Scholar中提取一些數據。我的PHP程序從我的本地計算機接收一個字符串,並將其傳遞給Google學術搜索,並在搜索結果頁面中取出第一個結果並將其保存到數據庫。Google學者Captcha驗證問題

我必須爲接近90萬個字符串/查詢做到這一點。問題是,在幾百個條目之後,程序停止,因爲Google Scholar要求驗證碼驗證。我能做些什麼?

回答

2

由於Google學術搜索沒有API,因此沒有記錄的方式來執行您想要的操作。你不應該這樣抓取數據,這就是爲什麼你會遇到谷歌的機器人保護功能。我認爲你唯一真正的選擇是等待Google創建一個API。

+0

或與Google談論你在做什麼! – duskwuff 2011-05-30 23:18:50

+0

我懷疑他們會迴應。已有Google羣組的線程請求API訪問權限。 – user775598 2011-05-30 23:20:30