2013-06-12 58 views
0

在SOLR 3.5文本字段中,StopFilterFactory在PorterStemFilterFactory之前列出。SOLR詞彙表和停用詞

這是否意味着如果我想停止例如「遊戲」和「遊戲」,我將不得不添加到停用詞?

如果是這樣的話,在PorterStemFilterFactory之後移動StopFilterFactory,並且將「遊戲」添加到停用詞中會導致「遊戲」和「遊戲」的出現被剝離?

我想真正的問題是做這件事的最好方法是什麼,我是否需要將單詞的所有變體添加到停用詞?

回答

2

PorterStemFilterFactory提供了積極的詞幹和有在之前停止詞過濾器可能不會導致適當的停用詞刪除,因爲根可能會不同,那麼你試圖停止。
只能在停用詞過濾器之前使用solr.EnglishMinimalStemFilterFactory才能添加複數處理。
這將處理複數,然後停用詞將需要處理單數版本。
然後,您可以添加PorterStemFilterFactory過濾器來處理正確的詞幹。

+0

謝謝 - 這個答案已經讓我的眼睛看到了solr如何被使用! – dice

+0

* before *表示如何爲特定字段排序這些過濾器? –