2017-07-26 118 views
1

我們將持有大量地址數據(我公司眼中的質量 - 每個客戶約150.000至500.000行)。Elasticsearch最佳實踐(地址)

地址數據包含約5列:

  1. 名1
  2. 名2
  3. 街(+號)
  4. 郵編

也許以後一些更多的東西(如電話,郵件等)

將每個客戶的地址池分配給一個碎片的最佳方式是? (該應用程序的用戶被分配給客戶並將地址池共享給客戶的所有用戶)

在此先感謝。

回答

0

「行爲明智」給每個客戶自己的索引(具有相同的映射)。 Elasticsearch可以使用單個查詢來查詢多個索引。索引可能由許多碎片組成。對於150 - 500.000份文件,您不需要that many shards。你可能沒有問題,只有一個,但根據查詢的數量,至少檢查1 - 5.