2015-09-03 40 views
1

我正在學習solr並希望使用solr來填充單詞。我會將這個單詞傳遞給solr,它應該發回詞幹。我知道如何爲不同的solr core配置干擾模式,我也能夠在分析器(solr管理員用戶界面)查看他們的詞幹詞,但我不知道如何使用java代碼實現這一目標。我能夠使用java api進行索引和查詢。Solr:Stemming words使用Solr

我正在使用solr-5.3.0。

+0

這裏是一個例子http://wiki.apache.org/solr/Solrj –

+0

@AbhijitBashetti:我經歷了這個例子。但是,我沒有得到如何從solr中得到這些詞語。我能通過JAVA API連接,添加文檔,刪除文檔,搜索等。我基本上想通過一個字假設擁抱通過JAVA API解決,並從它回來擁抱這個詞。怎麼做 ?我知道我可以看到我在schema.xml中的字段類型中指定的所有單詞列表,但我不明白如何通過java api來完成它。 – user4974500

+0

好了,你現在...我不thik可以通過java或solrJ ...或可能是....但爲此,你需要什麼所有apis被solr管理工具用來獲取數據.. –

回答

1

如果你需要幹掉這些詞,我建議你不要使用整個Solr。只需使用他們用於詞幹或類似的代碼即可。例如。您可以使用

org.apache.lucene.analysis.en.PorterStemmer.stem(String) 

不幸的是PorterStemmer有包級別的訪問,所以我只想從源頭上覆制它,或者你可以在互聯網上搜索一些其他的詞幹實現。我希望有所幫助。

祝你好運!

+1

順便說一句,我已經注意到Lucene Porter Stemmer Solr使用實際上是從這裏推導出來的:http://www.tartarus.org/~martin/PorterStemmer/index.html。您可以從源代碼頂部的註釋中注意到這一點。 – dpetruha