我google了很多,並閱讀了大量的文章,但得到了不同的反應。子域vs子目錄阻止爬蟲
如果我想讓我的網站的某個部分被搜索引擎索引,我對於哪一個更好一些有點困惑。基本上,我爲我的網站進行了大量更新,也爲客戶設計了很多更新,我不希望爲預覽上傳的所有「測試數據」進行索引,以避免重複的內容問題。
我應該使用一個子域和阻止整個子域
或
創建一個子目錄,並使用
robots.txt
阻止它。
我是新來的網頁設計和即將使用的子域(讀的地方,這是一個有點先進的過程,甚至一個小小的失誤就可能有大的後果有點不安全,而且馬特·卡茨也提到類似的東西(source):
「我建議你使用子目錄,直到你開始感到與你的網站的結構非常 有信心在這一點上,你會 更好的裝備,以做出正確的決定你自己的網站。「
但另一方面,我對使用robots.txt
以及任何人都可以訪問該文件猶豫不決。
兩者的優缺點是什麼?
現在我的印象是,谷歌同樣對待,最好去robots.txt
的子目錄,但我希望在「冒險」之前發表第二個意見。
如果你把它放在網上假設有人會複製它。 Robots.txt是可選的 - 不道德的搜索引擎可以並且會簡單地忽略它。如果必須成爲部署站點的一部分,請在您的「測試區域」上輸入用戶名/密碼。 –