我有數據源提供的文件的最新快照(而不是差異)。我希望同樣的快照能反映一下搜索的彈性搜索。我有以下選擇做同樣的:刷新數據:批量更新/去除VS索引從零開始別名爲
- 取一切從彈性(使用滾動),並計算內存和批量更新(索引行動大宗原料藥)同樣存在 - 將需要計劃舉行兩次儘可能多的內存來計算差異
- 批量更新(索引行動大宗原料藥)一切從快照,獲取該沒有更新爲彈性(與UID的過濾器和最近更新的搜索API)的一切,使軟另一批量請求刪除DIFF(與更新動作大宗原料藥) - 略好於1)我們並不需要從彈性下載大量的數據,只是DIFF
- 保持彈性兩個指標有一個別名,一個作爲當前「可搜索」副本,另一個作爲更新的備用。每當有新的快照進入時,我們可以使用備用的
[delete all documents][1]
,將快照中的所有內容批量更新爲待機狀態,並翻轉別名(alias API - 原子性)以更新一個,以便最新的被搜索。
注:DIFF應該是非常小的。
怎樣的方法2在性能和成本的彈性空間效率方面的做法比較3?
多少記錄/文件,我們談論關於? – Val
大約有30萬條記錄,但我真的很想了解,如果數據按比例放大,比如說達到100k,性能會受到怎樣的影響。 – Tweety