2016-07-11 205 views
0

我正在尋找一個分佈式實時計算系統,它將從kafka服務器收集數據,以便處理數據,然後將其存儲在ElasticSearch中。我已經選擇其中的一些:logstash和apache storm/spark streaming之間的主要區別是什麼?

  • 阿帕奇風暴
  • 阿帕奇火花流
  • 和Logstash(其更descripted作爲ETL(提取,轉換,負載))

我已經發現了幾個比較Storm和Spark Streaming的教程。但是,我沒有找到任何教程比較logstash風暴和火花流。這對我來說非常困惑,因爲我已經熟悉logstash,但我想確保爲我的需要選擇正確的工具。

預先感謝您

回答

2

Logstash是具有實時功能的數據收集引擎。它支持分析,存檔,監控,警報......基於一些預定義的指標。 - > Logstash是一種特定的產品,解決方案 Apache Spark和Storm是非常通用的分佈式實時計算系統。 - > Apache Spark/Storm只是一般用途的框架/庫。

+1

好的謝謝。與暴風雨和火花流相比,在什麼情況下logstash可能不夠用?此外,它在分配的表演方面是否有更好的進展? –

+0

我只需要了解爲什麼像Twitter這樣的公司使用風暴或火花流而不是logstash。對我來說,他們似乎做同樣的事情.. –

+0

讓我們看看github上的定義:https://github.com/elastic/logstash。 「Logstash是一個管理事件和日誌的工具,你可以用它來收集日誌,解析它們並存儲起來以備後用(比如搜索),如果你將它們存儲在Elasticsearch中,你可以使用Kibana查看和分析它們。 – NangSaigon

相關問題