2016-11-11 62 views
0

我在碎片和集合中有點混亂。我們可以使索引成爲新分片的新表,並且可以像集合一樣完成。何時使用collection vs shard?

何時製作新的碎片以及何時製作新的集合。

+0

重複https://stackoverflow.com/questions/35298435/understing-some-concepts-of-apache-solr/35299919#35299919的 – MatsLindh

+0

它不重複。在你的鏈接中,這些只是意味着我更專注於收集vs碎片,主要是在版本4中> –

+0

它們不是同一個概念。一個集合是_shards_的集合,它代表你的整個索引。如果您想要將集合擴展到更多服務器,請創建/分割新分片並將其移動。再平衡API可能對未來有所幫助。 – MatsLindh

回答

1

集合是SolrCloud集羣中的完整邏輯索引。例如,您可能有三種不同的集合,分別稱爲用戶,書籍和人物。

在邏輯層面上,整個索引被稱爲集合。這可能分佈在集羣中的許多節點上。

碎片是整個集合的一部分。即集合由一個或多個碎片組成。

何時使用收集?

Generally, users will create multiple Collections to separate logical units of data that will not be intermingled, similar to a database in the relational world. Collections are generally isolated from one another and do not typically communicate with each other. Also each Collections will each have their own unique schema.xml to define the types for their index.

當使用碎片?

If you feel your index is too big to be stored on one node . it can be divided into different shards and can be stored on different nodes on a cluster.

瞭解更多關於在這裏:​​https://thinkbiganalytics.com/solrcloud-terminology/

+0

我們可以在一個分片中創建不同的模式 –

+0

沒有。相同集合的分片將共享相同的模式。但是Collections將分別擁有自己獨特的schema.xml來爲其索引定義類型。 – root545