2014-02-18 79 views
1

你好,我是新來的Hadoop,並很困惑與版本名稱和哪一個應該我的1.x(大力支持和學習資源)中使用,或2.2 0.23。我的1.x中選擇其中的Hadoop版本,2.2和0.23

我已閱讀,Hadoop是移動以從v0.23(link1)完全紗。
但是同時它的所有hadoop v2.0網站都轉移到YARN(link2),我可以在Hadoop 2.2本身中看到YARN配置文件。

  • 但由於0.23似乎是最新的版本給我,難道還2.2支持 紗? (請參考鏈接1,它表示hadoop將支持YARN從 v0.23)
  • 而作爲初學者,我應該爲1.x或2.x版本去尋找hadoop的學習視角。
  • 是其他技術與豬一樣的Hadoop工程,蜂巢等 可以使用Hadoop的最新版本?

謝謝。

UPDATE
Thankyou all for reply。 我最終使用hadoop2.2,因爲所有着名的教程和資源都過時了,儘管我找到了一本開始使用v2.2的好書。

「的Hadoop權威指南,第三版」 由湯姆·懷特(Buy Here

支持Hadoop的V2.2。

源代碼是給在github https://github.com/tomwhite/hadoop-book如在github上提到

,這本書的代碼與測試

This version of the code has been tested with: 
* Hadoop 1.2.1/0.22.0/0.23.x/2.2.0 
* Avro 1.5.4 
* Pig 0.9.1 
* Hive 0.8.0 
* HBase 0.90.4/0.94.15 
* ZooKeeper 3.4.2 
* Sqoop 1.4.0-incubating 
* MRUnit 0.8.0-incubating 

希望它有助於.. !!!

+1

該書的鏈接已被打破。我發現這個商業版本:http://shop.oreilly.com/product/0636920021773.do –

+0

謝謝@MatthewCornell我更新了鏈接。 –

回答

3

有幾個主動發佈系列。 1.x發行版系列是0.20 發行版系列的延續。在0.23發佈後的幾個星期,原來被稱爲0.20.205的0.20分支重新編號爲1.0。在0.20.205和1.0之間幾乎沒有功能差異。這只是一個重新編號。

0.23包含幾個主要的新功能,包括一個稱爲MapReduce 2的新的MapReduce運行時,在稱爲YARN(另一個資源談判器)的新系統上實現,該系統是運行分佈式應用程序的通用資源管理系統。同樣,2.x版本是0.23版本系列的延續。所以2.2也支持YARN。

根據Hadoop 2.2 release note

  • 1.2.X - 當前穩定版本,1.2版本

  • 2.2.X - 當前穩定2。x版本

  • 0.23.X - 類似於2.X.X但遺漏NN HA。

我建議從Cloudera分佈開始,因爲你剛開始學習。 CDH 4.5包含您正在尋找的YARN功能。您也可以嘗試HortonWorks分配。與這些供應商合作的好處是,您無需擔心Hive,Pig等組件的哪個版本可以與您的Hadoop安裝配合使用。

+0

非常感謝。在cloudera或hortonworks上有限的學習資源不會有任何問題。我可以從電子書中找到大量資源,以及關於hadoop,pig等的視頻教程。但是我對上述2個發行版懷疑。 –

+0

這應該不成問題。所有關於您在網上找到的hadoop 2的學習資源也應該適用於這些分配。您還可以在其公司網站上找到分發特定功能。 – Lan

+0

非常感謝您 –

1

我建議你從hadoop-2.2.0開始,它提供了很好的知識。工業更喜歡YARN本身,並且在生產2.x中僅存在

+0

使用hadoop-2.2.0時,我是否會遇到使用v1.x的教程和指南時遇到的任何問題 –