我們正在爲特定搜索字詞記錄非常多的搜索次數: - 「biscru」或「Ticru」(過去2個月內爲63,000次)。 apache日誌顯示這些請求來自Google服務器,但我發現這很難相信並懷疑IP地址被欺騙。週期性Magento搜索字詞攻擊
Apache日誌舉例: -
rawliving.eu:66.249.72.227 - - [06/Jul/2013:01:25:09 +0100]
"GET /catalogsearch/result/index/?cat=47&dir=desc&limit=25&mode=list&order=event_date&p=6
&q=%22biscru%22+OR+%22Ticru%22
HTTP/1.1" 200 20587 "-" "Mozilla/5.0 (compatible; Googlebot/2.1;
+http://www.google.com/bot.html)"
顯然阻擋66.249.72.227是不是一個選擇,因爲它是一個有效的谷歌地址,以便任何人都可以提出什麼樣的選擇,我們必須防止這種失真,也許找出這些請求來自哪裏,爲什麼?
任何建議感激地收到。 Lee
假設Google會抓取搜索引擎頁面(如果它鏈接到互聯網上的任何地方)是合理的。更新您的robots.txt文件,並將robots標籤添加到您的佈局XML文件中,告訴Google單獨離開此頁面。 –
我們在同一個搜索詞上也遇到了超過350,000個點擊的相同問題。我對可能的DOS有同樣的想法,但是在做了一些挖掘之後,我們並不是唯一遭受這種困擾的人,而其他人也抱怨過。我不認爲簡單地阻止Google Bot抓取頁面就是答案,畢竟我希望我的搜索頁面被索引。我們試圖將NOFOLLOW放在我們搜索頁面返回的與產品無關的任何鏈接上,以查看這是否改正了問題(例如,類別和分層導航過濾器)。 – Ashley