2013-11-01 13 views
0

我想開始在營銷活動中使用特定的着陸頁。在google上快速搜索會顯示如何禁止使用robots.txt文件的特定頁面和/或目錄。 (link如何禁用着陸頁使用robots.txt文件?

如果我不希望搜索引擎爲這些登錄頁編制索引,我應該在robot.txt文件中放入單個頁面條目,還是應該將它們放在特定目錄中並禁止該目錄?

我的問題是,任何人都可以閱讀robots.txt文件,並且如果robots.txt文件中的實際頁面名稱是可見的,它就會失敗。

回答

1

「這違背了目的。」怎麼會這樣? robots.txt的目的是防止抓取工具讀取特定文件或文件組。無論是排除單個文件還是全部放入目錄,排除該目錄與抓取工具的行爲無關。

將它們全部放入目錄的好處是您的robots.txt文件更小,更易於管理。每次創建新的着陸頁時,您都不必添加新條目。

你說得對,在robots.txt中放置一個文件名可以讓任何讀取文件的人知道該文件在那裏。這應該不成問題。如果您有不希望別人看到的敏感信息,則不應該訪問它,無論它是否在robots.txt中提及。因爲如果該文件是可公開訪問的,那麼即使您沒有在robots.txt中提及該文件,bot也會找到它。

robots.txt只是一個準則。 robots.txt中禁用行的存在並不妨礙不友好的抓取工具查看這些頁面。它只是告訴爬蟲,你不希望他們看這些頁面。但是抓取工具可以忽略robots.txt。他們不應該,如果他們這樣做,你可以阻止他們,但robots.txt本身更像是一個停車標誌,而不是路障。