可能是這個問題以前有人問,但我認爲這是很好的今天再考慮它給這些技術已經成熟。我們正在考慮使用flume,kafka,抄寫員或其他人將流facebook和twitter個人資料信息存儲到hbase中,以便稍後進行分析。我們正在考慮flume的目的,但我沒有與其他技術合作以做出明智的決定。任何能夠釋放光線的人都會很棒!非常感謝。水槽VS卡夫卡VS別人
回答
的mediawiki(維基百科)經歷了這一點,並發表了他們是如何來到他們的選擇(卡夫卡)VS抄寫,水槽和其他人一個很好的文章。
http://www.mediawiki.org/wiki/Analytics/Kraken/Request_Logging
新鏈接:
https://wikitech.wikimedia.org/wiki/Analytics/Kraken/Logging_Solutions_Recommendation
摘要後人:
「我們的建議是Apache的卡夫卡,一個分佈式的發佈 - 訂閱消息傳遞系統設計吞吐我們評估有關十幾[1]從分佈式日誌收集,CEP /流處理,和實時消息傳送系統的結構域繪製最好的同類系統。雖然這些系統提供surprisingl y類似的特徵,它們在實施方面存在很大差異,並且每個特徵都針對特定的工作情況(更詳細的技術討論可作爲附錄獲得)。 「有趣的是,它也非常關注資源節約[2],以提供合理的折衷方案,放鬆保證以換取性能 - 某些東西可能不罷工的Facebook或谷歌作爲一個重要的特點在他們設計的系統。約束滋生的創造力。
「此外,卡夫卡具有特別感興趣的讀者操作的幾個特殊待遇。雖然它是用Scala編寫,它附帶有原生C++庫生產者可以嵌入我們的緩存服務器模塊中,從而不需要在這些服務器上運行的JVM。其次,生產者可以配置批量請求以優化網絡流量,但不要創建需要額外維護的持久本地日誌。 Kafka的I/O和內存使用情況由操作系統而不是JVM來決定[3]。在LinkedIn上製作的時候,每個數據中心有大約10,000名製作人員由8臺Kafka服務器處理,這些羣集將他們的數據流整合到一個分析數據中心中,Kafka支持通過簡單的鏡像配置盒
「這些功能是非常容易適合我們的預期使用情況。即使那些我們不打算使用的內容(例如「主題」類別的分片和路由選擇)也很有趣,並且在我們擴展目標時將來可能會有用。
「本文檔的其餘部分將深入更詳細地這些議題......」
鏈接現在似乎被破壞。 – tehAon
- 1. 卡夫卡源vs Avro源使用水槽讀取和寫入數據到卡夫卡頻道
- 2. Flume卡夫卡水槽中的org.apache.kafka.common.errors.RecordTooLargeException
- 3. 春季卡夫卡表現vs本地卡夫卡api
- 4. 卡夫卡vs兔MQ的優缺點
- 5. 用水槽或卡夫卡替換水龍頭
- 6. 水槽或卡夫卡的相當於mongodb
- 7. 如何設計卡夫卡連接即水槽以及來源
- 8. 作爲卡夫卡水槽的REST端點
- 9. 卡夫卡領導人選舉造成卡夫卡流崩潰
- 10. 大卡夫卡消息VS小消息+ DB
- 11. JMS vs特定條件下的卡夫卡
- 12. 的Java Vs的星火消耗卡夫卡消息
- 13. 卡夫卡連接匯合elasticsearch水槽(沒有發現類錯誤)
- 14. 虛擬卡VS SQL表聯繫人
- 15. Iterator.continually VS斯卡拉
- 16. 卡夫卡與碼頭工人
- 17. 卡夫卡:多經紀人架構
- 18. 無縫卡夫卡經紀人查找
- 19. 當卡夫卡副本的人下來
- 20. 卡夫卡經紀人與主題
- 21. 卡夫卡製片人時間戳
- 22. 卡夫卡製作人消息流
- 23. 多個經紀人卡夫卡0.7
- 24. 卡夫卡和ActiveMQ的區別
- 25. UnknownCodecException卡夫卡
- 26. 卡夫卡
- 27. 卡夫卡與斯卡拉
- 28. 阿帕奇卡夫卡多個生產者VS單生產者性能
- 29. 如何 「contramap」 阿卡流水槽
- 30. 卡夫卡Kubernetes/Minikube
當你談論水槽,想必你是指水槽-NG?因爲舊水槽與flume-ng非常不同。 – Shengjie