2010-07-13 74 views
0

指定變量我的URL結構設置兩個平行(都通向同一個地方):robots.txt中

  • www.example.com/subname
  • www.example.com/123

麻煩的是是,蜘蛛爬行成這樣的東西:

  • www.example.com/subname/default_media_function
  • www.example.com/subname/map_function

注意,名爲「子名」代表數千名在我的網站各個頁面都有相同的功能。

而且他們拋出錯誤,因爲這些鏈接嚴格用於JSON或AJAX的目的,而不是實際的鏈接。我想阻止他們訪問這些網頁,但如果URL包含變量,我該怎麼辦?

這將在robots.txt中工作嗎?

Disallow: /map_function 
+0

這一個肯定會工作 不允許:/ map_function/ – 2010-07-13 14:46:47

+0

你爲什麼寫這個答案?如果它是真的,我會給你信用:D – Trip 2010-07-13 16:23:17

回答

2

你將不得不做

Disallow: /subname/map_function 

機器人將尋找在根級的的robots.txt。此外,他們評估的網址從左到右沒有通配符。

因此,您需要爲所有map_function創建一個位置並排除該位置,或排除所有位置。

+0

人們通常動態地生成機器人腳本嗎?因爲var'subname'代表數千個不同的頁面,每個頁面都有相同的功能。我只是擔心做一個巨大的機器人.txt – Trip 2010-07-13 14:56:15

+0

我認爲你不需要擔心太多的大小。你最好的辦法是找到一種方法,把所有的元素放到一個目錄中,然後排除目錄... 禁止:/子名/限制/ 或類似的東西,它會省卻你對robot.txt的麻煩。不過,你也可以動態地做它如何創建對機器人無關緊要。 – 2010-07-13 14:59:13

+0

所以這是我採取的mod_rewrite問題。您可能會考慮使用#來指定您的參數 jquery合併它。我認爲機器人不會注意錨點 – 2010-07-13 15:02:52