背景: 我有一個巨大的數據流 - 每小時獲得1000000條記錄,ttl是3個小時......每個「文檔」包含大約20個屬性,我需要搜索最多同時使用「==」,「IN」和「BETWEEN」比較15個屬性。ElasticSearch或Couchbase或其他東西
由於大多數情況下不存在不可搜索的屬性,因此沒有理由將文檔存儲兩次(在Couchbase AND中的ElasticSearch索引中),所以我認爲將其存儲在ElasticSearch中是一個好主意。我是對的?
或者,也許有人可以推薦我更好的數據庫這樣的任務?我需要在今後的容易橫向擴展(MySQL的自定義分片不是一個選項)... 這個數據是某種形式的緩存,以便最終一致性和耐久性差是OK ...
根據CAP定理我需要主要是A和P ...
查詢是否即時更改或將始終使用大致相同的值查詢相同的屬性? – scalabilitysolved
我正在處理的系統是「旅遊聚合器/搜索」,數據項目實際上是包含:departuredate,depatturecountry,duration,度假村,hotelCategory,mealType,price,hotel等的旅行團。大多數時候人們搜索混凝土出發城市到具體出發日期範圍內的具體國家(或度假村)。 – dimzon