2011-07-12 78 views
0

Hallo,Carrot2集羣上的多個參數

我正在使用Solr和Carrot2的SearchEngine。

一切都很好,但胡蘿蔔做了一個奇怪的事情,我不明白。 我想從Solr獲得結果並使用胡蘿蔔對它們進行聚類。我整合了一切,它的運作良好,但Carrot只集中在我的一個屬性上。與結果匹配並且沒有其他屬性的那個。像:

數據

名:彼得 鎮:倫敦 愛好:高爾夫,滑雪

名稱:亞瑟 鎮:柏林 愛好:打高爾夫球,騎自行車

名稱:巴黎 鎮:倫敦 愛好:高爾夫,遠足

搜索:高爾夫球

集羣,如: 滑雪 騎自行車遠足

..但不是倫敦。

這不會自己提供我,但是當我使用CarrotClusteringWorkbench時,它會對其他參數進行聚類。

起初我試圖將工作臺中的配置導出到Solrconfig中,但它沒有任何改變。 Solr使用配置,但他們都沒有改變這個問題。

任何人都可以幫助我或擴展它嗎?

回答

0

您需要將字段的名稱放在solrconfig.xml中。要複製在Carrot2聚類工作臺爲你工作的配置,把這些在你的集羣請求處理程序(或查詢網址提供):

<!-- In Workbench this is "Title field name" --> 
<str name="carrot.title">name</str> 

<!-- In Workbench this is "Summary field name" --> 
<str name="carrot.snippet">features</str> 

一般來說,Carrot2效果最好用天然/非結構化文本,如搜索結果,文檔摘要或內容。如果您的字段包含表示某些結構化數據的字符串,那麼這些集羣可能會遠離您期望的(以及專用集羣算法可能產生的結果)。