2015-07-10 39 views
-3

對於天氣數據示例,Hadoop權威指南書中說Mapper功能鍵

「這些鍵是文件中的行偏移量」。

如何確定地圖功能的關鍵?它們是否始終是輸入文件中的行偏移量?如果輸入包含多個文件會怎麼樣?

回答

1

hadoop中的默認輸入格式是TextInputFormat。解釋here。在這種格式下,文件被分割成幾行,而關鍵字恰好是文件所在行的位置。

爲了理解如何分配鍵和值,您需要閱讀輸入格式,本書後面將在後面的整章中介紹這些格式。

祝你好運。

+0

我剛開始寫這本書,我會讀到的。謝謝。 – Akhil

+0

非常歡迎:) –