2015-01-13 85 views
0

我在我的項目中使用bigdata來縮短我的ETL執行的操作時間。是Cloudera的Impala的一個消耗內存的框架?

我想了解的是CloudEra Impala Framework內存密集型,因爲它非常快速地返回結果,並且比蜂巢和Pig快得多。我有一個數據集

說20-30萬條記錄,並且由我執行黑斑羚查詢操作,如組,並加入

所以你建議用黑斑羚,因爲它是快或使用蜂巢。我的整個目的是緊縮其現在正在用Oracle我的ETL操作的時間..

請諮詢關於內存使用和是特別建議...

而且,如果我們來認識任何鏈接Impala如何工作以及如何使用它的記憶將會有很大的幫助。

謝謝。!!!!!

回答