2016-01-22 53 views
1

我目前正在使用Sphinx搜索引擎,並且我有一些與wordforms和libstemmer有關的問題。 這裏是我的配置:Sphinxsearch Wordforms + Libstemmer

wordforms = /etc/sphinxsearch/wordforms.txt 

morphology = libstemmer_french, libstemmer_english 

http://sphinxsearch.com/blog/2015/09/09/sphinx-2-2-10-release/ 

當libstemmer被激活,在詞形等文件中的一些關聯不工作的。例如:girafe>長頸鹿,科學> sciense,aztec> azteque,louie> louis,... 當我disactivate libstemmer選項時,一切工作正常。

所以,我不明白,因爲libstemmer應該被稱爲詞形等,不之前,如何既libstemmer和詞形等工作。

回答

0

因爲libstemmer應該在wordforms之後調用,而不是之前。

之後應用。但是字形實現'形態異常' - 即如果一個單詞被字形改變,那麼形態就不會被應用。 (僅如果沒有應用wordform subsitition形態)


關於唯一的希望就是這麼一個小節目......

與版本2.1.1-β開始,...,如果行啓動用波形符號(「〜」)表示字形將應用於形態學之後,而不是之前。

...所以可以把libstemmed單詞放到wordforms中,然後你得到兩套處理。

+0

我試着在我的示例前添加一個波形符號,但問題依然存在。 – Relyss