使用StandardTokenizer，LowerCaseFilter和EdgeNgramFilter使用Lucence 5.2.0（最新）的索引文檔

-1

如何使用應用StandardTokenizer,LowerCaseFilter和EdgeNgramFilter來索引文檔？使用StandardTokenizer，LowerCaseFilter和EdgeNgramFilter使用Lucence 5.2.0（最新）的索引文檔

來源

2016-04-27 iNikkz

5.2.0不是Lucene的最新版本。 6.0.0是。 – femtoRgon

試試這個

<fieldType name="text" class="solr.TextField" positionIncrementGap="100"> 
      <analyzer type="index"> 
      <tokenizer class="solr.StandardTokenizerFactory"/> 
      <filter class="solr.LowerCaseFilterFactory"/> 
      <filter class="solr.EdgeNGramFilterFactory" minGramSize="1" maxGramSize="15" side="front" /> 
     </analyzer> 
    </fieldType>

與Java

public TokenStream tokenStream(String fieldName, 
        Reader reader) { 
       TokenStream result = new StandardTokenizer(reader); 

       result = new StandardFilter(result); 
       result = new LowerCaseFilter(result); 
       result = new EdgeNGramTokenFilter(result, Side.FRONT,1,20); 
       return result; 
      }

檢查這個link

來源

2016-04-27 11:01:07 vinod

謝謝，但我需要在lucene而不是solr。我需要使用lucene – iNikkz

java代碼中的示例。下面提到的鏈接可能會有幫助。分析儀分析儀=新分析儀（）{ @Override受保護的TokenStreamComponents createComponents（String fieldName，Reader reader）{ Tokenizer source = new StandardTokenizer（VERSION，reader）; TokenStream filter = new LowerCaseFilter（VERSION，source）; 返回新的TokenStreamComponents（source，filter）; } }; [https://lingpipe-blog.com/2014/03/08/lucene-4-essentials-for-text-search-and-indexing/] – vinod

使用StandardTokenizer，LowerCaseFilter和EdgeNgramFilter使用Lucence 5.2.0（最新）的索引文檔

回答

相關問題