2011-11-04 204 views
10

我一直聽到很多關於Apache Hadoop的信息,這是一種處理密集型服務的好方法。尋找Hadoop的基本介紹。像helloworld等效,然後可能是一個示例用例。Hadoop Hello World示例和簡介

回答

10

字計數示例代碼是如此簡單,任何人都可以新理解it.It有

https://hadoop.apache.org/docs/r1.2.1/mapred_tutorial.html#Example:+WordCount+v2.0

與將所有的haddop阿比前剛剛編譯:Hadoop的core.jar添加 創建。通過netbin的jar文件,當它與cmd中的hadoop一起運行時會感到驚訝。

如果你想要一個又一個,我已經做了須藤索引......像

Cow 2.txt 3.txt 4.txt 
Cat 1.txt 

etc. 

就問我,我會給你這是這麼simple.But我建議你應該運行此示例代碼第一。

現在,我還以爲你已經完成了前一個任務,所以這裏是用>> http://matrixsust.blogspot.com/2011/11/hadoop-simple-indexer-in-map-reduce.html

希望它可以幫助的鏈接。

+1

該鏈接404'd,因爲它似乎是最重要的結果之一,我認爲將更新的鏈接是好的。 – Acapulco

+1

我已經更新了鏈接並加上提醒;) –

3

在進入Hadoop之前,需要了解MapReduce(Hadoop基於MapReduce)。以下是MapReduce上的一些不錯的videos。在MapReduce上檢查谷歌的Paper

另外,如果您真的對Hadoop感興趣,Hadoop : The Definitive Guide是必須有書。