我正在索引大型數據集3000萬行,並且在每個重新索引(使用JDBC河流)之後,我看到索引總大小不一致。彈性搜索不一致的索引計數
我使用: 捲曲-XGET「http://localhost:9200/index_name/_count」
,結果每個重指數之後多達100000條有所不同。
我在日誌中看不到任何索引錯誤。
我正在索引大型數據集3000萬行,並且在每個重新索引(使用JDBC河流)之後,我看到索引總大小不一致。彈性搜索不一致的索引計數
我使用: 捲曲-XGET「http://localhost:9200/index_name/_count」
,結果每個重指數之後多達100000條有所不同。
我在日誌中看不到任何索引錯誤。
一種可能性是您的refresh_interval設置設置爲較高的數字。該選項用於減少磁盤IO。索引結果可能僅在此間隔期滿後纔可用。
您也可以使用刷新API來強制刷新。像這樣:
curl -XPOST 'http://localhost:9200/index_name/_refresh'
有關更多詳細信息,請參閱elastic documentation。
ElasticSearch用於統計索引中條目數的算法執行有界內存使用情況下的操作。這導致近似的結果。爲了提高精度,您可以設置
precision_threshold : AMOUNT_OF_ERROR
不過總有5%的誤差彈性搜索一個範圍
恐怕這並沒有幫助 – 2015-04-01 12:06:21