2012-04-26 26 views
3

我的schema.xml正在拆分產品名稱,然後使用RemoveDuplicate在拆分後刪除重複的單詞。爲什麼solr RemoveDuplicatesTokenFilterFactory不工作?

<fieldType name="type_name" class="solr.TextField"> 
     <analyzer type="index"> 
      <tokenizer class="solr.PatternTokenizerFactory" pattern="\|| " /> 
      <filter class="solr.LowerCaseFilterFactory"/> 
      <filter class="solr.RemoveDuplicatesTokenFilterFactory"/> 

而且在查詢分析器我看到RemoveDuplicatesTokenFilterFactory做絕對沒有重複的話。爲什麼?

enter image description here

回答

4

如果你讀Wiki你會看到,它只是在相同的位置,這是不是這裏的情況刪除重複。

+0

重複如何存在於同一個位置?什麼會導致它? – wormhit 2012-04-26 08:45:50

+2

就像維基所說的,例如用類似的詞根標記同義詞。 – 2012-04-26 08:59:36

+1

和有沒有一個過濾器,刪除重複不考慮位置? – lulalala 2012-06-07 09:22:55