我正在研究一個項目,我們每天導入50k-100k個數據點,位於時間上(YYYYMMDDHHmm)和空間上lon,lat),然後根據我們用戶設置的查詢參數動態呈現到地圖上。我們確實使用低於給定縮放級別的預先計算的羣集。時空系列的複合分區鍵(Cassandra)與交錯索引(Accumulo,BigTable)
在這種情況下,鑑於我們正在爲我們的存儲層選擇數據庫引擎,我目前正在評估Cassandra和BigTable的變體。
具體而言,我試圖理解在卡桑德拉與在BigTable的交織索引關鍵字,如一個GeoMesa使用利用複合分區鍵之間的差。
據我所知,這兩種方法都可以利用COTS硬件,並且可以進行調整以減少熱點並最大化空間填充。
我應該遵循什麼邏輯步驟來區分兩者?儘管我計劃在不久的將來對兩種方法進行測試,但我希望聽到更合理,更有教養的方法。