2017-04-12 63 views
0

Elasticsearch快照/恢復doc指出索引快照進程是增量式的。ElasticSearch增量快照不明確

您能否解釋一下它是什麼意思,並確認每個快照在恢復方面都是自治的?

使用案例:

比方說,我創建了存儲庫,幷包含所有指標在目前A.

不多久第一snapshotA(例如,一個小時後),我在創建所有指標的新snapshotB因爲此刻A.已更改的矩b1

有兩個問題:

  1. 是否snapshotB的尺寸W = ill等於所有索引的實際大小,並且包含B時刻的所有數據或僅包含部分數據:snapshotA和snapshotB之間的區別?

  2. 如果第二個,elasticseach如何計算該差異?

  3. 如果第二個,我們可以安全刪除snapshotA而不丟失snapshotB的數據嗎?

謝謝。

回答

1

快照在文件級別增量,而不是文檔級別。 每個分片都是Lucene索引,每個Lucene索引在後臺執行automatic segments merging。這些段是爲快照考慮的文件。

如果在時間點A,您的索引有5個分段,並且在B 3合併爲一個較大的分段時,在時間B獲得的快照將只在快照存儲庫中添加此新分段。在快照的元數據中,它將記錄它需要此文件以及創建快照A時已添加的其他兩個文件。

如果使用正常DELETE snapshot API Elasticsearch將刪除其他任何現有快照不需要的文件。在這個例子中,ES將刪除合併到較大的3個分段。不建議刪除快照的任何其他選項,並可能導致數據丟失。