2016-07-26 81 views
2

我想用Lucene 6.1.0實現語音搜索,使用Soundex或任何適合葡萄牙語的算法。我在互聯網上發現了很多不完整的例子,教導如何實現自定義的標記器,分析器,但似乎在版本6.1.0中,這些實例上使用的抽象類並不相同。任何人都可以指出我在哪裏可以找到一個好的文檔Lucene,不只是java文檔沒有任何進一步的文檔教學如何把這些東西放在一起?如何使用Lucene實現語音搜索?

在此先感謝。

回答

4

Analyzer documentation顯示瞭如何創建您的分析儀。

對於語音分析,您應該看看org.apache.lucene.analysis.phonetic包(您需要將「lucene-analysers-phonetic-6.1.0.jar」添加到您的構建路徑以及Apache的「commons-codec-1.10 .jar「,你可以get here)。

然後你可以設置你的分析類似,比如:

Analyzer analyzer = new Analyzer() { 
    @Override 
    protected TokenStreamComponents createComponents(String fieldName) { 
     Tokenizer tokenizer = new StandardTokenizer(); 
     TokenStream stream = new DoubleMetaphoneFilter(tokenizer, 6, false); 
     return new TokenStreamComponents(tokenizer, stream); 
    } 
}; 
+0

感謝。它運作良好。 –