2010-07-27 611 views
14

有人可以指向一個好的網站,有很好的Hadoop算法集合。例如,我現在可以用Hadoop完成的最複雜的事情就是Page Rank。除此之外,我可以做一些簡單的事情,如字數和東西。Hadoop地圖減少:算法

我想看到一個網站,顯示我的其他使用hadoop。

回答

1

本頁面給出了一些常見的地圖的一個很好的概述,從建立一個倒排索引中廣泛的應用減少模式,以實現網頁排名和做連接和其他集合運算

http://highlyscalable.wordpress.com/2012/02/01/mapreduce-patterns/

基本上,無論你看到線性代數(矩陣/矢量操作),就可以申請的Map Reduce。這意味着在協作過濾中有很多應用(比如Netflix推薦),集羣和其他機器學習算法。另一個非常有趣的項目是Mahout,該項目旨在通過Hadoop在MapReduce上實現可擴展的機器學習算法。

http://mahout.apache.org/