(來自Hadoop新手)Hadoop Map-Reduce OutputFormat將結果分配給內存變量(不是文件)?
我想在玩具Hadoop概念驗證示例中儘可能避免使用文件。我能夠從非基於文件的輸入中讀取數據(感謝http://codedemigod.com/blog/?p=120) - 這會生成隨機數字。
我想將結果存儲在內存中,以便我可以對其進行進一步的(非Map-Reduce)業務邏輯處理。 Essetially:
conf.setOutputFormat(InMemoryOutputFormat)
JobClient.runJob(conf);
Map result = conf.getJob().getResult(); // ?
似乎做我想做的是把結果保存在一個二進制文件輸出格式並重新讀取與等效輸入格式最接近的事。這似乎是不必要的代碼和不必要的計算(我誤解Map Reduce依賴的前提?)。
這讓Joe很有意義。謝謝。如果有更多人有任何意見,我會在等待一段時間後將答案標記爲正確。 –