我在我的項目中使用bigdata來縮短我的ETL執行的操作時間。是Cloudera的Impala的一個消耗內存的框架?
我想了解的是CloudEra Impala Framework內存密集型,因爲它非常快速地返回結果,並且比蜂巢和Pig快得多。我有一個數據集
說20-30萬條記錄,並且由我執行黑斑羚查詢操作,如組,並加入
所以你建議用黑斑羚,因爲它是快或使用蜂巢。我的整個目的是緊縮其現在正在用Oracle我的ETL操作的時間..
請諮詢關於內存使用和是特別建議...
而且,如果我們來認識任何鏈接Impala如何工作以及如何使用它的記憶將會有很大的幫助。
謝謝。!!!!!