2012-04-13 84 views
1

我已經差不多完成我的.htaccess文件,以便我的網址都正常工作。但是我有一個簡單的問題:搜索引擎優化友好的網址,以避免重複的內容

我有一個rewirte,看起來像這樣:

RewriteRule ^fishing/([^/]*)/?$ region.php?region=$1 [L] 

這工作,因爲如果我在釣魚/笛鍵入/它加載region.php文件。然而,我不知道也沒有想到的是,如果我輸入region.php?region = fife,那麼這也適用。

我相信這會給我重複的內容,我的SEO評級將受到影響。我如何使如果我輸入region.php?region = fife它會自動更改爲釣魚/ fife/????

回答

0

只要您不鏈接到非重寫URL結構(即region.php?region = fife),那麼網絡爬蟲就無法發現該URL,並且您將不會獲得重複的內容。

如果一個人輸入該URL並得到結果,那麼就SEO而言也沒關係。

所以只要確保只在你的應用中使用漂亮的URL結構。

+0

好的,但這裏是一個'RewriteRule^fishing/$ fishing.html [L]' 其中fishing.html仍然有效。這個抓取工具能夠看到嗎?那是不對的? – 2012-04-13 19:25:40

+0

從技術上講,爬蟲可以找到那個物理的fishing.html頁面。如果它位於沒有index.html文件的目錄中,並且允許目錄瀏覽,那麼爬蟲程序將能夠獲取該目錄中所有物理文件的列表並逐一找到它們。但是,如果需要,您可以使用robots.txt文件禁止特定文件或擴展名的每個文件。例如,如果您永遠不會在網址結構中使用擴展程序,則可以在您的robots.txt文件中添加「Disallow:/ *。html $'以防止抓取任何.html文件。 .php等 – 2012-04-13 19:33:18

+0

這聽起來像只是我需要的解決方案。我認爲你只需創建一個名爲robot.txt的文件並將其放置在你的網站的根目錄下? – 2012-04-13 19:35:31

1

更好的解決方案是canonical URLs。這告訴搜索引擎哪個URL是你想要在搜索結果中顯示的URL,並且到達該頁面的所有其他URL都是它的重複並且對該頁面的排名(包括傳入鏈接)進行計數。

你應該不是只是希望搜索引擎找不到其他頁面。如果他們這樣做是重複的內容,顯然你應該避免。

相關問題