2014-01-29 57 views
0

德語和德語等詞語經常粘在一起。例如,「質量控制」成爲「Qualitätskontrolle」(德)或「kwaliteitscontrole」(nl)。如何搜索Lucene中的德語/荷蘭語複合詞?

我該如何讓Lucene獨立搜索這樣的粘連詞語?即如果我搜索「qualität」或「kontrolle」,我想要找到「Qualitätskontrolle」。

這似乎是一個過濾器:DictionaryCompoundWordTokenFilter。但是,如何將它與荷蘭分析器和德語分析器連接起來進行索引和搜索?

回答

1

你必須編寫你自己的分析儀來包含一個過濾器。

子類GermanAnalyzer例如或從頭開始編寫一個,並將DictionaryCompoundWordTokenFilter包括到過濾器列表中。