2014-03-31 8 views
0

我有一個使用solr.SnowballPorterFilterFactory的solr模式。當我做管理員/分析 我看到對於查詢「iphone」,SnowballPorterFilterFactory後我得到「iphon」,即使架構中指定的文件(protwords_ro.txt)爲空。爲什麼solr.SnowballPorterFilterFactory如果protword文件爲空則剪切搜索詞的最後一個字母?

我已經刪除了過濾器,術語文本仍然是「iphone」。由於我的protwords_ro.txt文件是空的,我現在不需要過濾器,但我想知道爲什麼會發生這種情況。

回答

0

其實,這個過濾器是爲了阻塞。

在語言形態和信息檢索,詞幹是用於減少屈折(或有時衍生)的話他們的莖,基部或根部形狀一般是文字形式

因此,例如,用於過程字恢復此過濾器會給resum等

此外,

雪球詞幹依靠算法,並認爲相當積極

我認爲這就是爲什麼你得到iphon,即使你的文本文件是空的。

相關問題