2013-07-31 160 views
0

我在hadoop中使用Mahout進行數據挖掘算法。但在某些情況下它有問題。是否有任何其他數據挖掘庫與hadoop一起使用? 謝謝。hadoop的數據挖掘庫

+0

我個人沒有發現比Mahout更好的用例。恕我直言,僅僅因爲很少的錯誤而轉換好的東西並不是一件明智的事情。如果是這樣的話,那麼有一天你會對Hadoop提出同樣的問題。這個世界上的軟件是100%免費的錯誤? – Tariq

+0

您確定需要Hadoop支持嗎?您可以使用Hadoop加載和預處理數據,然後在單個節點上對其進行分析。除非您有Google縮放數據,否則這可能會起作用(速度會更快)。 –

回答

1

爲什麼不使用Spark?它是一個非常高效的開源集羣計算系統,既快速運行又快速寫入。對於分佈式數據挖掘,Spark是一個非常好的工具。

希望幫助!