2011-06-29 47 views
5

我剛剛通過solr wiki頁面進行集羣。但是我沒有得到使用集羣的好處。任何人都可以告訴我什麼是實際隱藏,以及它在索引和搜索中的用途。什麼是solr集羣組件

請回復

回答

9

聚類是一種統計技術來組數據中爲「屬於一起」基團。 在Solr中,這意味着它將嘗試對特定查詢的結果進行分組並標記這些組。

這可以給你返回結果的性質的額外信息。 示例:如果您在很大範圍的文檔集上搜索「Python」,則集羣組件可能會爲「Python編程語言」,「Python the snake」等創建組。

查看Carrot2爲演示演示網站:(Carrot2是隨Solr的聚類引擎)

http://search.carrot2.org/stable/search

Solr的羣集組件(Carrot2)羣集使用它們由Solr的一個結果列表返回文本字段中的文件。 (使用的字段是可配置的。) 它使用文本字段中的術語來構建羣集並對其進行標記。

還有就是Carrot2網站上一個很有趣的演示:

http://project.carrot2.org/publications/carrot2-dresden-2007.pdf

+3

當然, '巨蟒'! – JanRavn

+0

它將根據什麼來分組結果。我的意思是它如何標註結果 – Romi

+3

Solr的聚類組件(Carrot2)使用Solr返回的文本字段將文檔聚類在結果列表中。 (使用的字段是可配置的。) 它使用文本字段中的術語來構建羣集並對其進行標記。 Carrot2網站上有一個非常有趣的演示文稿: http://project.carrot2.org/publications/carrot2-dresden-2007.pdf – JanRavn