2012-09-25 65 views
0

我是Hadoop的新手,並試圖在數據倉庫和分析方面學習它。設置Hadoop數據倉庫環境(Hive)

有人能告訴我如何設置我的做法的機器,尤其是開始學習 2.Is它建議在Windows上設置所需的關於機器/節點的 1.Number? 3.需要安裝什麼軟件 4.測試/樣本數據的可用性

另外我想獲得有關使用Hive執行BI操作的最佳方法的建議。

謝謝。

回答

0

我建議下載cloudera虛擬機,如果你更感興趣的hadoop機械。另一種快速啓動的方式 - 使用亞馬遜EMR(彈性地圖縮小)。有一個選項可以在那裏創建交互式配置單元集羣,並開始播放存儲在S3中的數據集。
關於節點的數量 - 取決於目標。如果你有興趣「感受」一些hadoop性能 - 嘗試至少4-6節點。
如果您無權訪問組織的內部hadoop/hive羣集,上面列出的兩種方法都很好。即使在這種情況下 - 我建議在使用共享環境之前嘗試與他們取得一些動手。