2013-12-10 36 views
0

任何人都可以告訴我,索引服務中究竟意味着什麼噪音字?我正在研究Windows服務器索引服務並且遇到很多問題。 Some questions on it: Does indexing services not search for noise words? What is the location and name of noise word file on windows server?謝謝。索引服務中的「噪音詞」

回答

0

它們是相同的停止詞:

https://en.wikipedia.org/wiki/Stop-words

在計算中,停止字是其之前過濾掉,或之後,自然語言數據(文本)的處理的話。沒有一個確定的所有工具使用的停用詞表,並且這種過濾器並不總是被使用。一些工具特別避免將它們移除以支持短語搜索。

參見:

http://msdn.microsoft.com/en-us/library/ms693206%28v=vs.85%29.aspx

干擾詞充當短語查詢的佔位符。包含文本「wag the dog」的文檔被存儲在索引中,出現1時爲「wag」,出現3時爲「dog」。短語查詢「wag dog」不匹配,但短語查詢「wag a dog 「的確如此,因爲出現信息匹配

+0

我會在哪裏得到這個噪音文件?我在C:\ Windows \ System32中找到它。 –

+0

如果你已經找到了,你的問題是什麼? –

+0

有超過1個文件。 noise.enu,noise.jpn,noise.data等。那麼,哪個文件索引服務正在使用? –