2015-01-11 106 views
0

我有一個SAS應用程序,用於從Oracle提取數據並使用Base SAS和SAS宏生成報告。現在問題是我的數據庫日益龐大,從Oracle獲取數據需要更多時間,因此我的工作運行緩慢。構建用於Hadoop框架上的報告和分析的應用程序

所以我希望我的應用程序能夠構建在Hadoop上進行報告和分析。有人可以建議我任何方法,我需要使用什麼工具。

回答

0

簡短的回答是:這取決於。

卸載從Oracle數據我會建議你使用Sqoop(http://sqoop.apache.org/),它是專爲這個特定的使用情況,甚至可以做增量負載,可以卸載的數據

當數據創建蜂巢表卸載後,您可以使用Impala構建您所需的報告。 Impala本身可以與Hive表一起工作,所以唱歌非常簡單。當然,您必須將您的SAS代碼重寫爲一組可以在Impala上運行的SQL語句。

接下來,如果你需要的可視化工具,在它上面運行,你可以嘗試這樣的Tableau或任何其他工具,它能夠利用ODBC/JDBC來連接黑斑羚

最後,我認爲Hadoop的+ Sqoop + Impala將覆蓋您的需求。但我建議你也看看MPP數據庫,因爲使用SAS意味着你有相當結構化的數據,MPP數據庫將更適合這種情況。

+0

感謝您的建議。在這裏有替代SAS的替代品嗎,我的意思是,我可以用R或其他工具替代SAS來生成Excel報告。還可以使用Hive/Impala生成excel報告。 – Paul

+0

不,Hive和Impala將能夠生成將由您的Excel應用程序讀取的CSV文件。如果它還不夠,你可以用Java/Python/R /等編寫一個簡單的應用程序。這將創建一個xlsx文件爲您提供csv,這非常簡單。但無論哪種方式,我建議您切換到一些商務智能解決方案,他們在報告中更好,除了生成Excel報告之外,還有更多功能 – 0x0FFF

相關問題