我在Hadoop HDFS中有幾串.csv格式的數據,在幾個GBs.i中有一個機場的飛行數據。有不同的延遲,如載波延遲,天氣延遲。 NAS延遲等如何從HDFS/Hadoop中的數據實現儀表板
我想創建的內容報告在特定的路線,最大延遲航班明智等
有e.g最大延遲我是新來的Hadoop世界的儀表板。
thnak you
我在Hadoop HDFS中有幾串.csv格式的數據,在幾個GBs.i中有一個機場的飛行數據。有不同的延遲,如載波延遲,天氣延遲。 NAS延遲等如何從HDFS/Hadoop中的數據實現儀表板
我想創建的內容報告在特定的路線,最大延遲航班明智等
有e.g最大延遲我是新來的Hadoop世界的儀表板。
thnak you
您可以試試Hive。類似於SQL。
您可以使用簡單的create table語句將HDFS中的數據加載到表中。
Hive還提供內置函數,您可以利用它來獲得必要的結果。
許多數據可視化工具可用,一些常用的有
這些工具爲我們提供功能來創建自己的儀表板。
我之前做過這些事。我會列出所有我按步驟執行的操作,您可能會發現它很有幫助。
select
查詢時,Impala比配置單元更好,速度更快。每次將數據加載到配置單元表時,只需刷新即可。瞧!
我想創建儀表板,那麼我如何可視化任何網頁上的數據?我是否需要將結果存儲在RDBMS中,然後將其顯示到儀表板? –
我已經更新了我的答案,您需要存儲在HDFS中(不在RDBMS中)。 –