我需要爲Hadoop MapReduce應用程序實現自定義(服務)輸入源。我google'd和SO'd,發現一種方式繼續是實現一個自定義InputFormat。那是對的嗎?Hadoop MapReduce InputFormat已棄用?
顯然根據http://hadoop.apache.org/common/docs/r0.20.2/api/org/apache/hadoop/mapred/InputFormat.html已棄用InputFormat的方法getRecordReader()和getSplits()。什麼是替代品?
Hadoop的字計數例如仍然使用相同的...
你的問題實際上是在不同版本之間。 `0.20.2`(最新的穩定版本)的大部分問題是它明確棄用功能而沒有版本內替換。 `MultipleOutputs`和`org.apache.hadoop.mapred`幾乎全部都是這種情況。這似乎表明了我一直在關注的API的重大重組。 (回答即將出現,一旦我編譯了足夠的源代碼信息。) – MrGomez 2010-12-08 05:01:07