我想知道在哪裏存儲由cassandra提供的數據。 就像一個「數據湖」,在那裏我可以放置所有處理過的數據,在一天結束時或類似的東西。與apache cassandra一起使用的最佳數據存儲文件系統?
我正在尋找可以防止丟失數據的分佈式可靠存儲解決方案。
Cassandra的文件系統名爲CFS,但在哪裏存儲?
我想知道在哪裏存儲由cassandra提供的數據。 就像一個「數據湖」,在那裏我可以放置所有處理過的數據,在一天結束時或類似的東西。與apache cassandra一起使用的最佳數據存儲文件系統?
我正在尋找可以防止丟失數據的分佈式可靠存儲解決方案。
Cassandra的文件系統名爲CFS,但在哪裏存儲?
Cassandra以實時異步複製的形式構建了彈性。在大多數情況下,在EXT4,ZFS等之外擁有任何類型的特殊文件系統都可能導致Cassandra世界出現問題。
大多數用戶依賴Cassandra的複製,儘管有些用戶也選擇合併備份,他們傾向於上傳到雲存儲或單獨的mnt點。
如果您的意思是您想從Cassandra獲取數據並將其存儲在其他位置(如數據盤),我建議使用Spark從Cassandra有效地批量讀取數據,然後寫出到平面文件或系統你的選擇。
老,但對整體卡桑德拉性能有很大的文章,並有一個關於文件系統會議(搜索文件系統部分):
https://tobert.github.io/pages/als-cassandra-21-tuning-guide.html
在卡桑德拉,丟失數據的最好的保護是一個高複製因子和快照。