我目前正在運行一個項目,我們需要每年爲大約2億個帳戶存儲400億個文檔(PDF,TIFF),並且想知道是否可以使用Cassandra進行此操作?這主要是因爲Cassandra設計中的可擴展性,穩定性和多個數據中心的使用。Cassandra用於存儲文檔
但我想知道爲此使用Cassandra是否是一個好主意 - 或者像CouchDB這樣的另一種選擇是更好的選擇嗎?
剛一說明,我們不需要在文件全文檢索,併爲每個文檔只會有一個有限的連接到每個元數據 - 獨特的ID,如日期,時間,來源,所有者和,再加上一些關鍵字。通常通過對所有者ID的查詢來完成對文檔的訪問,並從那裏選擇通過原始和可選的日期/時間需要的文檔。所以沒有什麼幻想。
感謝您對此的看法。