2
我想用Lucene 6.1.0實現語音搜索,使用Soundex或任何適合葡萄牙語的算法。我在互聯網上發現了很多不完整的例子,教導如何實現自定義的標記器,分析器,但似乎在版本6.1.0中,這些實例上使用的抽象類並不相同。任何人都可以指出我在哪裏可以找到一個好的文檔Lucene,不只是java文檔沒有任何進一步的文檔教學如何把這些東西放在一起?如何使用Lucene實現語音搜索?
在此先感謝。
我想用Lucene 6.1.0實現語音搜索,使用Soundex或任何適合葡萄牙語的算法。我在互聯網上發現了很多不完整的例子,教導如何實現自定義的標記器,分析器,但似乎在版本6.1.0中,這些實例上使用的抽象類並不相同。任何人都可以指出我在哪裏可以找到一個好的文檔Lucene,不只是java文檔沒有任何進一步的文檔教學如何把這些東西放在一起?如何使用Lucene實現語音搜索?
在此先感謝。
Analyzer documentation顯示瞭如何創建您的分析儀。
對於語音分析,您應該看看org.apache.lucene.analysis.phonetic包(您需要將「lucene-analysers-phonetic-6.1.0.jar」添加到您的構建路徑以及Apache的「commons-codec-1.10 .jar「,你可以get here)。
然後你可以設置你的分析類似,比如:
Analyzer analyzer = new Analyzer() {
@Override
protected TokenStreamComponents createComponents(String fieldName) {
Tokenizer tokenizer = new StandardTokenizer();
TokenStream stream = new DoubleMetaphoneFilter(tokenizer, 6, false);
return new TokenStreamComponents(tokenizer, stream);
}
};
感謝。它運作良好。 –