我正在研究簡單的地圖縮減程序。我想在縮減器之後爲密鑰中的每個不同的單詞創建不同的文件。例如,在執行的MapReduce後,我有這樣的事情減速器中的多個輸出
優先級爲1×2
優先級爲1 Y 2
優先級爲1 Z 2
優先級2×2
優先級2 Y 2
現在在縮小階段之後,我想要不同的文件,並根據優先級說明Priority1和Priority2具有所有這些值。我正在使用java,並想知道這種輸出應該寫在reducer中嗎?
我只是想知道這是甚至可能或者如果是如何處理或解決這個問題? 我正在使用Hadoop 0.20.203,因此多輸出不起作用。
任何指針都會有幫助。 感謝您的幫助! Atul
特別是當您創建輸出格式時,您如何處理爲每個單詞創建新文件?通常情況下,輸出文件是在調用OutputFormat.getRecordWriter(context)時創建的,所以如何知道如何命名文件? – Huckle 2012-07-02 22:30:43