我使用from/size pagination迭代大型未排序查詢結果集,同時索引而不是部分查詢結果集。忽略scroll/scan對我的方案更有效的高效解決方案,我可以期待一致的結果嗎?elasticsearch未分類大小/索引時分頁
據我所知,如果我同時索引作爲結果集的一部分的文檔,我應該期望重複和缺少結果。在這種情況下,我索引的文件是而不是部分結果集,我不確定我收到的不一致結果是否是由於此分頁策略而預期的行爲。
我正在使用elasticsearch版本1.2.2。我已經證實查詢的構建與文檔一致。
{
"from" : 0, "size" : 50000,
"query" : {
"term" : { "user" : "kimchy" }
}
}
-
{
"from" : 50000, "size" : 50000,
"query" : {
"term" : { "user" : "kimchy" }
}
}
總是返回文檔的正確數量(約260萬美元),大部分時間出現在正確地定義文件的副本少數(約10) 。
如果您正在索引的文檔不是結果集的一部分,那麼他們沒有任何理由影響您的結果。 – ThomasC 2014-09-24 13:18:09
是的,這是因爲碎片合併的緣故。 – dr0i 2017-03-21 13:22:46