我的團隊正在Amazon EC2實例上部署新羣集。 經過一番研究,我們決定與Apache Mesos一起作爲集羣管理器和Spark進行計算。從Mesos羣集收集日誌
我們問自己的第一個問題是從每個不同框架的所有機器收集日誌的最佳方法。 到目前爲止,我們開發了一些自定義的bash/python腳本,它們從預定義的位置收集日誌,壓縮它們並將壓縮文件發送到S3。 這種旋轉是由每小時運行一次的cron作業激活的。
我一直在尋找「最好」(或標準)的方式來做到這一點。 我發現Apache Flume,它也是一個數據收集器日誌,但我不明白它怎麼可能被集成到一個Mesos集羣來收集日誌(和Spark)。
我發現this「類似」的問題,但解決方案不是開源或不再支持。
有沒有更好的方法來旋轉日誌或我失蹤的標準方式?
非常感謝你
你看過logstash(與Elasticsearch和Kibana結合)嗎? https://www.elastic.co/products/logstash它是開源的(apache 2)並且受到支持。 –
logstash是一個非常不錯的解決方案,但在架構中添加Elasticsearch和Kibana會給系統增加更多的複雜性(我們試圖儘可能簡化) – besil