我對分佈式計算技術感興趣。作爲Java開發人員,我可能願意從Hadoop開始。你能否推薦一些書籍/教程/文章開始?我從哪裏開始使用分佈式計算?
回答
也許您可以先閱讀一些與MapReduce和分佈式計算相關的論文,以便更好地理解它。這裏有一些我想推薦:
的MapReduce:大規模集羣上的簡單數據處理,http://www.usenix.org/events/osdi04/tech/full_papers/dean/dean_html/
的Bigtable:分佈式存儲系統的結構化數據,http://www.usenix.org/events/osdi06/tech/chang/chang_html/
樹精:分佈式來自順序構建塊的數據並行程序,http://pdos.csail.mit.edu/6.824-2007/papers/isard-dryad.pdf
並行計算的景觀NG的研究:從伯克利來看,http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.67.8705&rep=rep1&type=pdf
在另一方面,如果你想知道的Hadoop的更好,也許你可以開始閱讀的Hadoop MapReduce框架的源代碼。
目前,bookwise我想看看 - Hadoop A Definitive Guide。它由Tom White編寫,他現在已經在Hadoop工作了很長時間,並與Doug Cutting(Hadoop創建者)在Cloudera工作。
同樣在免費的一面,來自UMD的Jimmy Lin寫了一本名爲:Data-Intensive Text Processing with MapReduce的書。這裏有一個鏈接到最終的預生產verison(鏈接提供作者在他的website)。
All Things Hadoop Podcast http://allthingshadoop.com/podcast有一些很好的內容和好客人。它很多都是面向分佈式計算開始的。
MIT 6.824是最好的東西。只有閱讀與Hadoop相關的Google論文是不夠的。如果你想更深入的話,系統的課程學習是必需的。
如果您希望學習一個比Hadoop更簡單的分佈式計算平臺,您可以試試Zillabyte。你只需要知道一些Ruby或Python在平臺上構建應用程序。
正如LoLo所說,Hadoop是一個功能強大的解決方案,但可能很難開始。
欲瞭解有關分佈式計算的材料,請嘗試使用http://ocw.mit.edu/courses/electrical-engineering-and-computer-science/6-824-distributed-computer-systems-engineering-spring-2006/syllabus/。本課程還推薦了幾種資源。
- 1. 從哪裏開始進行分佈式計算/並行處理? (Python/C)
- 2. 從哪裏開始計算機視覺
- 3. 從哪裏開始使用神經科學進行計算?
- 4. 我從哪裏開始使用RESTful API?
- 5. 我從哪裏開始使用XAML?
- 6. 我從哪裏開始使用C#?
- 7. Mean.js,我從哪裏開始?
- 8. - 從哪裏開始?
- 9. 從哪裏開始
- 10. 從哪裏開始在HTML5畫布
- 11. 從哪裏開始使用傅里葉分析
- 12. 我從哪裏開始編寫我自己的計算器程序
- 13. 虛擬化和雲計算 - 從哪裏開始?
- 14. 計算機視覺,檢測道路,從哪裏開始?
- 15. 從哪裏開始/分割mpeg2-ts
- 16. 從哪裏開始使用MS Dynamics
- 17. 使用Moq和TDD,從哪裏開始?
- 18. 從哪裏開始使用FastCGI和C++
- 19. 從哪裏開始使用Direct2d?
- 20. 從哪裏開始使用GKMinmaxStrategist?
- 21. 從哪裏開始使用API
- 22. SSAS - 你從哪裏開始使用它?
- 23. 從哪裏開始使用API的
- 24. 我從哪裏開始優化JVM?
- 25. 我應該從哪裏開始ORACLE
- 26. 我從哪裏開始改變主頁?
- 27. jQuery Treeview - 我從哪裏開始?
- 28. RFID + Android - >我從哪裏開始?
- 29. 動態內容 - 我從哪裏開始?
- 30. 紋理流,我從哪裏開始?