我正在優化我的網站谷歌的搜索引擎,最近我注意到,當做一個「網站:www.joemajewski.com」查詢,我得到的頁面結果不應該被索引。谷歌搜索引擎優化幫助
讓我們來看看這個頁面,例如:http://www.joemajewski.com/wow/profile.php?id=3
我創建了自己的CMS,而這僅僅是用戶ID#3的統計數據的細分,這是我注意到的是由谷歌索引,雖然它不該不會的。我知道,Google的結果需要一段時間才能準確反映我網站的內容,但現在已經有近6個月的索引不正確。
這裏是我所採取的預防措施:
我robots.txt
文件中有這樣一行:
Disallow: /wow/profile.php*
當運行通過谷歌網站管理員工具中的網址,表示我沒有,事實上,正確地創建disallow命令。但是,它確實聲明,如果鏈接到的頁面可能仍然顯示在搜索結果中,則該頁面不會被抓取。因此,我又採取了一項預防措施。
在源代碼中,我包括以下內容元數據:
<meta name="robots" content="noindex,follow" />
我假設follow
意味着計算PageRank時等使用的頁面,以及noindex
告訴谷歌以不顯示的頁面在搜索結果中。
此頁面profile.php用於獲取$ _GET ['id']並找到相應的註冊用戶。它顯示了一些關於該用戶的信息,但沒有足夠的相關性來保證在搜索結果中顯示,所以這就是爲什麼我試圖阻止Google將其編入索引。
這不是Google索引的唯一一個我想刪除的頁面。我也有一個WordPress博客,並且有很多我想刪除的類別頁面,標籤頁面和存檔頁面,並且正在執行相同的過程以嘗試刪除它們。
有人可以解釋如何從Google的搜索結果中刪除頁面,也可能有一些標準可以幫助確定哪些類型的網頁我不想編入索引。就我的WordPress博客而言,我真正想要索引的唯一頁面是我的文章。我試圖阻止的其他任何事情都是由Google帶來的。
有人也可以解釋爲什麼沒有提供任何新的或相關的內容(如WordPress標籤或類別的頁面)索引的網頁很糟糕,這些內容顯然不會接收來自Google的流量。
謝謝!