讓我首先說我是一個Hadoop的新手。我的要求是使用Hadoop基礎結構分析服務器日誌文件。我在這個方向上採取的第一步是使用Flume HDFS接收器對日誌文件進行流式處理並將它們原始轉儲到單節點Hadoop集羣中。現在我有一個看起來像這樣記錄的一堆文件:處理HDFS文件
時間戳REQ-ID級別模塊名消息
我的下一步是解析文件(分離出字段),並將它們存儲回去以便他們準備好進行搜索。
我應該用什麼方法呢?我可以使用Hive來做到這一點嗎? (抱歉,如果問題是天真的)。互聯網上可用的信息是壓倒性的。