我有一個系統,每行生成100,000行,每行的大小爲1KB,並希望使用Cassandra進行數據庫。 我從Apache Kafka獲取數據,然後將其插入數據庫。 將此卷數據加載到Cassandra的最佳方式是什麼?Cassandra大容量加載數據
回答
卡夫卡連接是專爲此設計的。在此頁面上,您可以找到包含Cassandra水槽連接器的連接器列表https://www.confluent.io/product/connectors/
我從kafka獲取CSV郵件。看起來連接器使用avro格式。我真的嗎? –
不確定有關CSV郵件,但json除了avro還可以使用: http://docs.datamountaineer.com/en/latest/cassandra-sink.html#legacy-topics-plain-text-payload-with-a -json-string 老實說,寫一些像流應用程序這樣的東西可能會更容易將CSV轉換爲json或avro,然後將其寫入可以拉入Cassandra的新主題。您也可以編寫自己的CSV轉換器或嘗試使用Kafka附帶的StringConverter。不知道這將如何與Cassandra一起工作,但這些選項中的任何一個都比編寫自己的完整應用程序更容易。 – dawsaw
從CSV到JSON或AVRO的數據轉換可以在一個小的Apache CAMEL模塊中輕鬆實現。它支持Kafka連接,所以你可以從Kafka中讀取,轉換並回寫到@dawsaw提到的Kafka。您還可以根據需要對其進行縮放。 – Gautam
- 1. Cassandra大容量加載 - NoHostAvailableException
- 2. 加載大量數據
- 3. 加載大數據集的Java(ArrayList中的最大容量)
- 4. Cassandra:大容量傳感器數據說明
- 5. 向cassandra插入大量數據
- 6. 大容量加載數據轉換錯誤
- 7. 大容量加載數據轉換錯誤
- 8. 加載大量數據/內容時網頁滾動緩慢
- 9. Silverlight的 - 無法加載大量數據
- 10. 在後臺加載大量數據
- 11. 使用Node.js的大量數據加載
- 12. 加載大量的JSON數據
- 13. 加載大量的excel數據與EPPlus
- 14. Django燈具,加載大量數據
- 15. 加載和分析大量數據
- 16. Datagrid中加載大量數據的
- 17. 幫助加載大量數據
- 18. 如何加載大量數據?
- 19. 將大量數據加載到Postgres Hstore
- 20. cassandra python數據加載失去連接
- 21. Cassandra加載數據不正確
- 22. 什麼是Cassandra的良好批量數據加載工具
- 23. HBase大容量加載jar問題
- 24. GREG服務大容量加載
- 25. SQL Server大容量插入「批量加載數據轉換錯誤」
- 26. Cassandra數據存儲大小
- 27. Cassandra - 批量過大
- 28. Cassandra超時cqlsh查詢大量(ish)數據量
- 29. 將大量數據加載到Oracle SQL數據庫中
- 30. 從Android中的Sqlite數據庫加載大量的數據
將數據拆分成批。最好批量大小爲1000,並將數據寫入cassandra db。 – kai