我正在研究利用機器學習算法的項目,並且我選擇hadoop/mahout是因爲它可以更好地處理大數據。Hadoop平臺中的任何其他機器學習庫(mahout除外)
但象夫唯一集成幾個算法,(不包括某些算法,像SVM),所以我想知道的是那裏的Hadoop平臺,除了象夫的任何其他機器學習庫
如果是的話,我有一些問題關於新圖書館
- 它支持分佈式計算
- 是它正式發佈?任何支持?
非常感謝〜
我正在研究利用機器學習算法的項目,並且我選擇hadoop/mahout是因爲它可以更好地處理大數據。Hadoop平臺中的任何其他機器學習庫(mahout除外)
但象夫唯一集成幾個算法,(不包括某些算法,像SVM),所以我想知道的是那裏的Hadoop平臺,除了象夫的任何其他機器學習庫
如果是的話,我有一些問題關於新圖書館
非常感謝〜
基本上可以在Hadoop上使用了Weka或許多其他工具。請記住,只有ML算法基於map-reduce技術,您才能從hadoop + ML算法中受益。否則不會有任何改進。我不確定,但我強烈懷疑SVM是基於map-reduce ...
看看Apache Hama
,它們具有簡單的ML算法,如Logistic Regression
或K-means
集羣。未來會有更多的算法。
這裏是他們的地盤:
https://github.com/onurakpolat/awesome-bigdata#machine-learning --take看看。希望有所幫助。