0
我正在尋找一個分佈式實時計算系統,它將從kafka服務器收集數據,以便處理數據,然後將其存儲在ElasticSearch中。我已經選擇其中的一些:logstash和apache storm/spark streaming之間的主要區別是什麼?
- 阿帕奇風暴
- 阿帕奇火花流
- 和Logstash(其更descripted作爲ETL(提取,轉換,負載))
我已經發現了幾個比較Storm和Spark Streaming的教程。但是,我沒有找到任何教程比較logstash風暴和火花流。這對我來說非常困惑,因爲我已經熟悉logstash,但我想確保爲我的需要選擇正確的工具。
預先感謝您
好的謝謝。與暴風雨和火花流相比,在什麼情況下logstash可能不夠用?此外,它在分配的表演方面是否有更好的進展? –
我只需要了解爲什麼像Twitter這樣的公司使用風暴或火花流而不是logstash。對我來說,他們似乎做同樣的事情.. –
讓我們看看github上的定義:https://github.com/elastic/logstash。 「Logstash是一個管理事件和日誌的工具,你可以用它來收集日誌,解析它們並存儲起來以備後用(比如搜索),如果你將它們存儲在Elasticsearch中,你可以使用Kibana查看和分析它們。 – NangSaigon