2012-10-23 39 views
0

我正在使用Apache solr,我正在嘗試使用語音過濾器工廠,我嘗試了所有可用於solr.PhoneticFilterFactory的編碼器,但它們都不支持印度語言。是否有任何其他過濾器/方法可用,這樣我可以得到印度語言e.g印地文,泰米爾語,孟加拉語等印地語語音過濾器工廠

如果沒有,那麼我們怎樣才能修改現有的過濾器,以支持這些語言語音表示。

回答

0

您是否嘗試了新的Beider Morse濾波器工廠,該工廠剛剛在3.6版本中添加,並且(唉)還沒有很好記錄?

https://wiki.apache.org/solr/AnalyzersTokenizersTokenFilters#solr.BeiderMorseFilterFactory

它爲中心的語音搜索和東歐姓氏開發的,但也許它會爲其他語言的工作了。我個人發現它比Soundex或其他老式的方法好得多。

+0

我試過這個filterFactory它似乎不支持印地語。 – NutchUser

+0

試過這個過濾器。它不適用於印地文名稱。 – Vivek