我的網站有查詢數據庫;填寫CAPTCHA會給你5分鐘的查詢時間。還有一些自定義代碼可以檢測任何自動腳本。我這樣做,因爲我不希望有人數據挖掘我的網站。允許Google繞過CAPTCHA驗證 - 明智與否?
問題是,Google在抓取我的網站時看不到搜索結果。如果有人正在搜索查找結果中存在的字符串,我希望他們通過Google搜索來查找此頁面。
給我最明顯的解決方案是使用PHP變量$_SERVER['HTTP_USER_AGENT']
繞過CAPTCHA和自定義的安全代碼,谷歌機器人。我的問題是這是否合理。然後
人們可以使用谷歌的緩存來查看查找結果,而無需填寫驗證碼,但將谷歌自己的腳本檢測方法防止其數據挖掘這些網頁嗎?
還是會有某種方式爲人們做出$_SERVER['HTTP_USER_AGENT']
顯示爲谷歌繞過安全措施?
在此先感謝。
我不是專家,但我會說,如果有人想挖掘你的數據庫,他們會弄清楚?爲什麼不是一個capatcha只是將每秒請求的數量限制在人性化的可能範圍內呢?像每10秒左右一次 – studioromeo 2010-04-12 11:15:03
我很確定這會落入「你不能發送一件事給谷歌機器人和另一件事給用戶」的'類別'。這種「針對普通用戶而不是針對Google」的流程可能會降低您的知名度。 – Narcissus 2010-04-12 11:31:07
我無法想象任何情況下,你的整體設計會很好。如果您的網站上有一些公開信息,則應該在具有永久地址的網頁上可見,並且該網頁應該列在網站導航的某個位置,以便任何搜索引擎都可以對其進行索引。任何查找定義爲臨時重新排列,不應緩存或索引。你能解釋你爲什麼使用這種方法嗎? – 2010-04-12 11:36:56