我是Hadoop的新手,因此如果我的問題太不成熟,我很抱歉。我們如何處理來自Hadoop DB的處理數據(輸出)?
我知道Hadoop用於分析大數據集上的數據。 最後,我們如何處理分析的數據,我們創建報告和演示文稿?
例如對於 如果在SSRS報告的情況下,報告將基於使用SQL查詢從RDBMS中提取的結果數據生成。
但是,基於Hadoop的數據庫如何工作?從客戶端請求特定報告,這需要Hadoop數據庫中的數據點,然後流程如何? 我相信客戶端不會直接在hadoop上運行Job來爲其報告生成提取所需的數據,因爲hadoop作業需要更多時間來處理。
我的問題是,通過運行處理的數據(結果集)是否被存儲在任何中間體DB上的hadoop DB MR作業,像RDBMS? ,以便客戶端可以提取生成報告所需的數據?
請在此澄清我。