Googlebot偶爾會使用錯誤的查詢字符串參數爲我們的某個網站編制索引。我不知道它是如何得到這個查詢字符串參數(沒有任何網站鏈接到我們的壞鏈接,並沒有在我們的網站插入壞值)。正如我們所期望的那樣,這個壞的參數會導致網站拋出500錯誤。爲什麼Google(或Googlebot)索引返回500錯誤的頁面?
我的印象是,谷歌不會索引頁返回500錯誤,但事實證明,這是。所以現在我有兩個問題:
1)爲什麼Googlebot會插入隨機錯誤的查詢字符串值? (我真的不關心這個問題的答案,但如果我們能做些什麼來避免這種情況,它會解決我們的問題。)
2)爲什麼谷歌索引返回500錯誤頁面?
這裏是因爲Googlebot創建的錯誤鏈接之一,谷歌已經收錄:
http://www.pbs.org/teacherline/catalog/browse/?sa=4&gb=baqhuxts&gb=20&gb=21&num=20&page=2&js=0&sa=1
壞的參數是GB = baqhuxts。參數'gb'預計是一個整數。如果您從查詢字符串中刪除該參數,您應該會看到一個很好的目錄頁面。
關於nofollow的和robots.txt的解決方案:[刪除]
我,現在我是個白癡,把一個meta標籤,告訴搜索機器人對網頁進行索引實現。那是一件愚蠢的事情。我正在刪除這些。 W-(
如果search on Google for 'baqhuxts'你會發現,它已收錄10頁有這個壞參數,但每個頁面返回500錯誤。沒有人有任何關於爲什麼谷歌認爲,這些都是有效的頁面索引的洞察力?
什麼具體在查詢字符串是錯誤的?也就是說,爲了得到一個有效的結果,那個URI需要改變什麼?這可能有助於解釋發生了什麼。 – VoteyDisciple 2009-08-20 21:24:19
好抓@voteydisciple。我添加了對查詢字符串中的錯誤的解釋。 'gb'參數預計是一個整數。 – shawnr 2009-08-20 21:31:59
該網站底部的版權是一年。 – Davis 2009-08-20 23:37:09