我需要存儲的信息推到卡夫卡在深存儲。我們正在使用Azure雲服務,因此我認爲Azure Blob存儲可能是更好的選擇。我想使用Kafka Connect的sink connector API將數據推送到Azure Blob。卡夫卡文檔大多建議HDFS導出數據,但在這種情況下,我需要一臺運行Hadoop的Linux虛擬機,我猜這會很昂貴。我的問題是Azure Blob存儲是存儲JSON對象和構建自定義接收器連接器的合適選擇,對於這種情況是一個合理的解決方案?卡夫卡連接器Azure的Blob存儲
0
A
回答
2
定製信宿連接肯定能行。卡夫卡連接是絕對的設計,所以你可以插入連接器。事實上,連接器開發是完全聯合的。 Confluent的JDBC和HDFS連接器由於這兩種用例的普及而首先實現,但還有很多(我們保留着一個我們知道的連接器列表here。
就Azure blob存儲是適當的,你提到的JSON對象。我想你需要考慮的唯一事情就是物體的大小和Azure存儲能否處理大小&數量的對象很好,我不知道Azure存儲的特點,但在很多其他對象的存儲系統可能需要許多對象合併爲一個斑點,以獲得良好的表現,適合於大量的對象(即你可能需要支持許多JSON對象的文件格式)。
相關問題
- 1. 卡夫卡,新的存儲
- 2. 關閉卡夫卡連接
- 3. 卡夫卡foreing鍵連接
- 4. 卡夫卡連接問題
- 5. 卡夫卡到Tableau連接
- 6. 連接到卡夫卡VirtualBox
- 7. 卡夫卡連接器 - Packacking罐子
- 8. 卡夫卡連接或卡夫卡客戶
- 9. 如何從卡夫卡連接器獲得卡夫卡引導配置設置
- 10. 卡夫卡連接Elasticsearch - 的NoSuchMethodError
- 11. 卡夫卡:分銷過程和存儲
- 12. WSO2 EI611卡夫卡連接錯誤
- 13. 弗林克卡夫卡連接
- 14. 匯合卡夫卡連接爲Oracle
- 15. 將Pentaho連接到Azure Blob存儲
- 16. Tinymce ImageManager連接到Windows Azure Blob存儲
- 17. 我應該使用什麼:卡夫卡流或卡夫卡消費者API或卡夫卡連接
- 18. PubSub的卡夫卡連接節點連接端
- 19. 如何使卡夫卡源重新連接時,卡夫卡重新啓動
- 20. 錯誤運行多個獨立的卡夫卡HDFS連接器
- 21. 卡夫卡控制器無法連接到經紀人
- 22. 卡夫卡源連接器得到陳舊偏移值
- 23. 卡夫卡匯合S3連接器「無法找到類」
- 24. 推日誌,以從卡夫卡連接器
- 25. 卡夫卡HDFS連接器 - 沒有完全合流
- 26. 在卡夫卡接收器連接器上設置唯一的客戶端ID
- 27. 卡夫卡連接接收器任務忽略文件偏移量存儲屬性
- 28. Azure的Blob存儲
- 29. Azure Blob存儲列表Blob
- 30. Azure blob存儲 - blob策略
對於自定義接收,我想想吧'好的。目前,Azure Blob存儲沒有官方接收器。如果想要另一個解決方案,可以與Apache水槽(卡夫卡源和Azure的水槽)試試,看到這個鏈接以供參考:https://blogs.msdn.microsoft.com/bigdatasupport/2014/03/18/using-apache-水槽與 - hdinsight / – NangSaigon