2012-06-01 134 views

回答

1

RevolutionAnalytics/RHadoop實施RHadoop項目包通過rhdfs,rhbase和RMR連接的Hadoop和R。

我知道使用K-means聚類算法的「標準」方式(使用Python,Pig和Java,如幻燈片8-10所示)與僅使用R(使用rmr軟件包,如幻燈片14- 15):它需要更少的代碼,並且可以在一個單一的語言

實現在同一個文檔有一個comparison implementation of K-means in Python, Java and R它展示瞭如何容易,如果你對你的Hadoop運行此包是使用R.

您肯定可以在Hadoop上編寫K-means聚類。

IF R是不是你的選擇,然後K-均值聚類(建立使用MapReduce的)可以用Hadoop和Mahout的,所以你一定能做到這一點的Hadoop集羣。