我正在編寫一個mapreduce作業,並且我想要將這些輸入傳遞給內存中的映射器。hadoop - 我如何使用內存中的數據作爲輸入格式?
將輸入傳遞給映射器的常用方法是通過Hdfs - sequencefileinputformat或Textfileinputformat。這些輸入格式需要在fdfs中有文件,這些文件將被加載並分割成映射器
我無法找到一個簡單的方法來傳遞,讓我們來說說映射器的元素列表。 我發現自己必須將這些元素寫入磁盤,然後使用fileinputformat。
任何解決方案?
我在java offcourse寫代碼。
謝謝。
我有一個簡單的代碼,獲取文件系統中的路徑,並返回路徑下所有文件的列表。我想在羣集上運行此代碼以獲得更好的結果。所以我想在映射器中有這個代碼,並且只需要收集reducer。我想給每個映射器一個輸入一個路徑來運行它。我有一個內存中的根路徑列表,我想將它們作爲輸入傳遞給我的映射器。 這是用例。也許有更好的方法來做到這一點在地圖縮小。 – user1251654 2012-07-25 09:03:51