2015-07-05 102 views
1

我目前正在爲列出產品的網站重新建立內部搜索引擎。這個搜索引擎有3個類別,多選擇選項,客戶希望他的搜索是「搜索引擎優化友好」,因此他希望搜索選項在名稱中的URL,因爲他認爲這將使其搜索引擎友好。搜索引擎優化和大量的表單/ Javascript鏈接的搜索功能

問題是,搜索產生的URL可能會破壞2000個字符,而且有多少選項可能會無窮無盡,我認爲有超過10000個組合。搜索網址當前通過Javascript發送給瀏覽器,而不是通過帶提交按鈕的表單元素。我懷疑搜索引擎甚至會抓住後者。

我不認爲有可能使這種搜索搜索引擎友好。我相信重複內容的數量可能會導致懲罰。除了SE不檢索搜索鏈接之外,什麼是合適的解決方案?

回答

0

從用戶的角度來看,我認爲> 2000個字符的網址是您最大的問題,因爲例如IE will only handle URLs up to 2083 characters。我相信這應該是一個交易斷路器。

前段時間我們(Google)寫了一篇關於分面導航的文章,我認爲這適用於您的案例:Faceted navigation best (and 5 of the worst) practices。最糟糕的做法,部分提到:

最差實踐#2:使用目錄或文件的路徑,而非參數列出不會改變網頁內容的值。
最差做法:
example.com/c123/s789/product?swedish-fish
(其中/ C123 /是類別,/ S789 /是不改變網頁內容的會話ID)

良好做法:
example.com/gummy-candy/product?item=swedish-fish&sid=789
(目錄/ gummy-candy /,以有意義的方式更改頁面內容)

最佳實踐:
example.com/product?item=swedish-fish&category=gummy-candy&sid=789
(URL參數允許搜索引擎更大的靈活性來決定如何有效地抓取)

這是困難的自動化程序,如搜索引擎爬蟲,區分有用的值(例如,「橡皮糖的糖果」)從無用的(例如,「sessionID」)值直接放在路徑中。另一方面,URL參數爲搜索引擎提供了靈活性,以便快速測試並確定給定值何時不需要爬蟲訪問所有變體。

的JavaScript一般不應該是一個問題,至少在大的搜索引擎,谷歌和必應承認都渲染HTML,獲取外部資源的必要,就像將一個標準的瀏覽器。在這裏你必須密切關注robots.txt指令所禁止的資源。如果搜索引擎無法抓取關鍵資源進行渲染,他們可能完全誤解了該頁面。