1
在Hadoop的縮小階段之後,我希望輸出文件名是有意義的,具體取決於輸入鍵值。然而,我沒有成功地在「Hadoop:Definetive Guide」中使用MultipleTextOutputFormat來做這件事。原因是它基於舊的API,它不適用於新的API?如何使用MultipleTextOutputFormat類將默認輸出文件重命名爲一些有意義的名稱?
任何人都可以提示解決方案或指向相關文檔嗎?
在Hadoop的縮小階段之後,我希望輸出文件名是有意義的,具體取決於輸入鍵值。然而,我沒有成功地在「Hadoop:Definetive Guide」中使用MultipleTextOutputFormat來做這件事。原因是它基於舊的API,它不適用於新的API?如何使用MultipleTextOutputFormat類將默認輸出文件重命名爲一些有意義的名稱?
任何人都可以提示解決方案或指向相關文檔嗎?
你可能是對的。在舊API中工作的大多數東西並不總是在新的API中工作。
現在有一個「新方法」,叫做MultipleOutputs。