0
我完全不熟悉數據分析,我需要一些建議來啓動一個新項目。 我有許多來自不同外圍設備的日誌文件,它們是自動付款機器的一部分。日誌文件每天都會生成,每個文件的長度在10k到100k之間。此外,日誌文件具有或多或少相同的結構(時間戳,類別,ProcID,ThreadID,方法,消息)。
我需要做的是:日誌分析和數據彙總
- 應用一些查詢到每一個文件提取有關從日誌不同外設的每個外部
- 彙總信息來重建信息的交易流程
哪些完成這項任務的最佳技術/框架?
我剛開始使用Apache Lucene進行日誌解析,但我會很欣賞任何形式的建議。
目前我對編程語言沒有任何限制,但最好是Java,C#或Python。
謝謝!
感謝您的回覆,我會研究你的建議 –