2010-05-12 58 views

回答

9

也許您可以先閱讀一些與MapReduce和分佈式計算相關的論文,以便更好地理解它。這裏有一些我想推薦:

在另一方面,如果你想知道的Hadoop的更好,也許你可以開始閱讀的Hadoop MapReduce框架的源代碼。

3

目前,bookwise我想看看 - Hadoop A Definitive Guide。它由Tom White編寫,他現在已經在Hadoop工作了很長時間,並與Doug Cutting(Hadoop創建者)在Cloudera工作。

同樣在免費的一面,來自UMD的Jimmy Lin寫了一本名爲:Data-Intensive Text Processing with MapReduce的書。這裏有一個鏈接到最終的預生產verison(鏈接提供作者在他的website)。

1

MIT 6.824是最好的東西。只有閱讀與Hadoop相關的Google論文是不夠的。如果你想更深入的話,系統的課程學習是必需的。

2

Hadoop不一定是解決所有分佈式計算問題的最佳工具。儘管其強大,它也有一個相當陡峭的學習曲線和擁有成本。 您可能想澄清您的要求,並在Java世界尋找合適的替代方案,例如HTCondor,JPPFGridGain(我對那些我沒有提到的道歉)。

1

如果您希望學習一個比Hadoop更簡單的分佈式計算平臺,您可以試試Zillabyte。你只需要知道一些Ruby或Python在平臺上構建應用程序。

正如LoLo所說,Hadoop是一個功能強大的解決方案,但可能很難開始。

欲瞭解有關分佈式計算的材料,請嘗試使用http://ocw.mit.edu/courses/electrical-engineering-and-computer-science/6-824-distributed-computer-systems-engineering-spring-2006/syllabus/。本課程還推薦了幾種資源。