我正在使用Cassandra來存儲我解析的站點日誌。我有兩個具有多個二級索引的列族。日誌數據本身大小約爲30 GB。然而,cassandra數據庫的大小是〜91g。有什麼辦法可以減少這家商店的大小?另外,將有多個二級索引對數據存儲大小有重大影響?Cassandra數據存儲大小
2
A
回答
4
潛在地,二級指標可能會產生很大的影響,但很明顯,這取決於您對它們的投入!如果大多數數據條目都出現在一個或多個索引中,那麼這些索引可能佔您存儲空間的很大一部分。
您可以看到每個列族使用JConsole和/或'nodetool cfstats'有多少空間。
您還可以查看磁盤數據文件的大小以瞭解使用情況。
也有可能數據沒有經常刷新到磁盤 - 這可能導致很多commitlog文件長時間留在磁盤上,佔用額外的空間。如果您的某些列系列僅輕載,則會發生這種情況。請參閱http://wiki.apache.org/cassandra/MemtableThresholds以獲取調整參數。
如果您有很多小列,那麼列名可能會佔用相當大比例的存儲空間,所以在有意義的情況下可能需要縮短它們的大小(如果它們是時間戳或其他有意義的數據,則不是這樣)。 。
相關問題
- 1. Cassandra存儲vs內存大小調整
- 2. Cassandra緩存大小和JVM堆大小
- 3. GAE轉到數據存儲大小
- 4. 本地存儲數據庫大小
- 5. infinispan文件存儲大小與數據大小不成比例
- 6. Cassandra存儲數據的哪個節點?
- 7. 分佈式數據存儲 - Hazelcast與Cassandra
- 8. 在cassandra中存儲冗餘數據
- 9. Mongodb和Cassandra數據存儲機制
- 10. Cassandra在BLOB中存儲數據
- 11. cassandra中的數據存儲問題
- 12. Apache Cassandra磁盤上的數據存儲
- 13. Cassandra數據庫行大小是否受可用內存限制?
- 14. cassandra無法存儲跨分區大小限制的關係嗎?
- 15. 減少Google應用引擎的大小數據存儲存儲數據
- 16. 在cassandra中存儲小文件
- 17. 如何在Cassandra中存儲小文件?
- 18. Cassandra DB:可以在Cassandra數據庫中存儲XML文件嗎?
- 19. ODBC存儲大小
- 20. 數據大小沒有限制時的有效數據存儲
- 21. 不同的數據存儲大小和數據配額
- 22. Cassandra和堆大小
- 23. Cassandra最小堆大小
- 24. Salesforce最小化數據存儲大小的最佳實踐
- 25. Azure Blob存儲區中元數據的最大大小
- 26. 數據存儲中實體的最大大小?
- 27. 什麼是存儲數據的最大大小
- 28. 使用密鑰存儲無限大小的巨大json數據
- 29. 存儲大數據python
- 30. 存儲大量數據點?
感謝您的DNA提示!我做了一些分析,發現快照也佔用了很多空間。 –
好點 - 您可以使用nodetool本地和全局刪除快照,或者只是手動刪除它們。 – DNA