2014-01-17 82 views

回答

1

所有不是「關係型工作負載」的東西(例如,你也可以用SQL數據庫來做的東西)並不是非常適合Hive。 Hive可能總是有辦法做到這一點(主要是因爲UDF可用),但它不會「輕鬆」。

您正在區分「Hadoop」和「Hive」。然而,「Hadoop」是一個相當通用的術語:它可能意味着「HDFS」(分佈式文件系統),「YARN」(資源管理器)或「Hadoop」作爲谷歌建議的「Map Reduce」算法的實現。在比較Hadoop和Hive時,我假設你參考了「Map Reduce」。

我想說計算一個page-rank with MapReduce可能是相當惱人的蜂巢。另一個例子是計算TF-IDF with MapReduce

相關問題