2009-08-20 41 views
7

Googlebot偶爾會使用錯誤的查詢字符串參數爲我們的某個網站編制索引。我不知道它是如何得到這個查詢字符串參數(沒有任何網站鏈接到我們的壞鏈接,並沒有在我們的網站插入壞值)。正如我們所期望的那樣,這個壞的參數會導致網站拋出500錯誤。爲什麼Google(或Googlebot)索引返回500錯誤的頁面?

我的印象是,谷歌不會索引頁返回500錯誤,但事實證明,這是。所以現在我有兩個問題:

1)爲什麼Googlebot會插入隨機錯誤的查詢字符串值? (我真的不關心這個問題的答案,但如果我們能做些什麼來避免這種情況,它會解決我們的問題。)

2)爲什麼谷歌索引返回500錯誤頁面?

這裏是因爲Googlebot創建的錯誤鏈接之一,谷歌已經收錄:

http://www.pbs.org/teacherline/catalog/browse/?sa=4&gb=baqhuxts&gb=20&gb=21&num=20&page=2&js=0&sa=1

壞的參數是GB = baqhuxts。參數'gb'預計是一個整數。如果您從查詢字符串中刪除該參數,您應該會看到一個很好的目錄頁面。

關於nofollow的和robots.txt的解決方案:[刪除]

我,現在我是個白癡,把一個meta標籤,告訴搜索機器人對網頁進行索引實現。那是一件愚蠢的事情。我正在刪除這些。 W-(

如果search on Google for 'baqhuxts'你會發現,它已收錄10頁有這個壞參數,但每個頁面返回500錯誤。沒有人有任何關於爲什麼谷歌認爲,這些都是有效的頁面索引的洞察力?

+0

什麼具體在查詢字符串是錯誤的?也就是說,爲了得到一個有效的結果,那個URI需要改變什麼?這可能有助於解釋發生了什麼。 – VoteyDisciple 2009-08-20 21:24:19

+0

好抓@voteydisciple。我添加了對查詢字符串中的錯誤的解釋。 'gb'參數預計是一個整數。 – shawnr 2009-08-20 21:31:59

+0

該網站底部的版權是一年。 – Davis 2009-08-20 23:37:09

回答

4

這可能是因爲你告訴谷歌索引它在你的元標籤有這樣的:

<meta name="robots" content="index,follow"> 

嘗試刪除! :)

+0

謝謝,丹! – shawnr 2009-08-20 23:42:17

1

不幸的是我只知道答案#1:

谷歌會爬怪異的網頁一樣,因爲人與谷歌工具欄去那個不存在的網頁,和他們瀏覽的信息被髮送到谷歌這就是爲什麼你會通常會查找沒有任何業務被編入索引的頁面,例如,從任何地方鏈接到的phpmyadmin頁面。

+0

我明白你所描述的事情發生了,那確實是一件棘手的事情。但請參閱最新的問題 - 我不想全面禁止目錄網址。 還是你說我的500頁應該有一個元標記禁止機器人索引? – shawnr 2009-08-20 23:36:30

相關問題