我有2個版本的solr在我的機器上工作。說SolrVer1
和SolrVer2
Solr - 通配符搜索隨着方法的不同而變化
SolrVer1
已經應用,下面詞幹法字段類型text_en_splitting
<filter class="solr.KeywordMarkerFilterFactory" protected="protwords.txt" ignoreCase="true"/>
<filter class="solr.PorterStemFilterFactory" ignoreCase="true"/>
SolrVer2
已經應用,下面詞幹法字段類型text_en_splitting
它適用於經常幾乎相同搜索,但在使用通配符搜索時,通配符搜索不會給出語法結果SolrVer1
像搜索ray*
,SolrVer1
返回非常少的數據與SolrVer2
相比。當我觀察結果,然後我發現SolrVer1
不返回數據只有ray
和rays
。
我不知道我應該在哪裏使用SnowballPorterFilterFactory
和我應該在哪裏使用PorterStemFilterFactory
。他們有什麼優點和缺點?
任何人都可以有這個想法嗎?
感謝
感謝@arun,爲您的答覆。它非常有幫助。所以你建議我應該使用'SnowballPorterFilterFactory'? – meghana
一般來說,雪球(包括波特)莖稈被認爲是侵略性的,這意味着它們會將很多詞映射到相同的莖。很難告訴你應該使用哪一個stemmer,因爲這取決於你的搜索需求。我會建議詢問你的客戶的例子。您應該閱讀https://wiki.apache.org/solr/LanguageAnalysis#Stemming來了解各種Solr詞幹的差異,並根據您的需求選擇正確的詞彙。 – arun
感謝@arun您的回覆,我想您是對的,我會問我的客戶的例子。:) – meghana