2013-07-06 30 views
4

我們正在爲特定搜索字詞記錄非常多的搜索次數: - 「biscru」或「Ticru」(過去2個月內爲63,000次)。 apache日誌顯示這些請求來自Google服務器,但我發現這很難相信並懷疑IP地址被欺騙。週期性Magento搜索字詞攻擊

Apache日誌舉例: -

rawliving.eu:66.249.72.227 - - [06/Jul/2013:01:25:09 +0100] 
"GET /catalogsearch/result/index/?cat=47&dir=desc&limit=25&mode=list&order=event_date&p=6 
&q=%22biscru%22+OR+%22Ticru%22 
HTTP/1.1" 200 20587 "-" "Mozilla/5.0 (compatible; Googlebot/2.1; 
+http://www.google.com/bot.html)" 

顯然阻擋66.249.72.227是不是一個選擇,因爲它是一個有效的谷歌地址,以便任何人都可以提出什麼樣的選擇,我們必須防止這種失真,也許找出這些請求來自哪裏,爲什麼?

任何建議感激地收到。 Lee

+0

假設Google會抓取搜索引擎頁面(如果它鏈接到互聯網上的任何地方)是合理的。更新您的robots.txt文件,並將robots標籤添加到您的佈局XML文件中,告訴Google單獨離開此頁面。 –

+0

我們在同一個搜索詞上也遇到了超過350,000個點擊的相同問題。我對可能的DOS有同樣的想法,但是在做了一些挖掘之後,我們並不是唯一遭受這種困擾的人,而其他人也抱怨過。我不認爲簡單地阻止Google Bot抓取頁面就是答案,畢竟我希望我的搜索頁面被索引。我們試圖將NOFOLLOW放在我們搜索頁面返回的與產品無關的任何鏈接上,以查看這是否改正了問題(例如,類別和分層導航過濾器)。 – Ashley

回答

3

將此添加到您的layout-xml定義中,例如local.xml中

<catalogsearch_result_index translate="label"> 
     <reference name="head"> 
      <action method="setRobots"><value>NOINDEX,NOFOLLOW</value></action> 
     </reference> 
    </catalogsearch_result_index> 
    <catalogsearch_advanced_index translate="label"> 
     <reference name="head"> 
      <action method="setRobots"><value>NOINDEX,NOFOLLOW</value></action> 
     </reference> 
    </catalogsearch_advanced_index> 
    <catalogsearch_advanced_result translate="label"> 
     <reference name="head"> 
      <action method="setRobots"><value>NOINDEX,NOFOLLOW</value></action> 
     </reference> 
    </catalogsearch_advanced_result> 

檢查是否仍有問題,幾天後...或者只是使用robots.txt文件被索引阻止catalogsearch網址。

+1

這只是阻止Google機器人 - 我認爲這個問題是關於一種類似的DDoS攻擊,它將自己僞裝成Google bot。 –