設置梗概:合併集合跨越多個碎片分裂
5×SolrCloud(Solr的4.6.1)節點實例(單獨的機器)。
該設置旨在存儲最近48小時的webapp日誌(這是相當激烈的......〜3MB /秒)
「日誌」集合有5個分片(每個節點實例一個)。
一個的logline代表「日誌」集合
如果我繼續存儲日誌文件,以這種「日誌」的收集,對碎片內核開始變得非常大,CPU圖表顯示實例花費越來越多的時間中的一個文件等待磁盤I/O。
因此,我的想法是每15分鐘創建一個新集合,並將它命名爲「logs-201402051400」,分散在5個實例中的碎片。文檔編寫者一旦創建,就會開始寫入新的集合。在某些時候,我會得到收集這樣的名單:
...
日誌-201402051400
日誌-201402051415
日誌-201402051430
日誌-201402051445
日誌-201402051500
...
由於SolrCloud中某些特定時間段內最多有192個集合(〜1000個核心)。看起來搜索性能應該會急劇下降。
所以,我想將目前未寫入的集合合併到一個大集合中(但仍分散在5個實例中)。我已經找到了有關如何合併核心的信息,但我如何合併集合?