2009-11-19 34 views
0

我正在使用Microsoft SharePoint搜索(MOSS)搜索網站上的所有頁面。Microsoft SharePoint搜索 - 忽略頁面的各個部分

我的問題是,當您搜索出現在網站的頁眉,頁腳,菜單或標籤雲部分中的單詞時,該單詞將出現在每個頁面上,因此搜索服務器將爲您帶來一個結果列表對於該搜索詞:網站上的每一頁。

理想情況下,我想告訴搜索服務器忽略其搜索索引中的某些HTML部分。

This website似乎來形容我的問題,和一個人說「爲什麼不隱藏自己的網站中的這些部分,如果用戶代理是搜索服務器。

這種做法的問題是,大部分路段的我躲包含對其他網頁的鏈接(菜單的和標籤雲)等履帶將達到一個死衚衕,很遠就不會爬。

任何人有關於如何解決這個問題有什麼建議?

回答

1

我不知道我是否正確閱讀這篇文章,你不希望搜索將索引中的部分內容包含在索引中,但是你可以希望它進入該部分並遵循其中的任何鏈接?

我認爲最好的方法是確實排除那些基於用戶代理的部分(即將它們添加到用戶控件,並且如果用戶代理是MS Search,則不顯示該部分)。

由於這些部分在每個頁面上都是相同的,因此可以在搜索爬蟲出現時排除它們。

只需創建一個頁面(即站點地圖:-D)。其中包括普通用戶在頁腳/標題/等中看到的所有鏈接。抓取工具然後可以使用該頁面跟蹤更深入您網站的鏈接。這也會提升性能,因爲爬蟲只會遇到鏈接一次而不是每個頁面。