0
我有一個hadoop系統正在運行。它共有8個地圖插槽並行。 DFS塊大小爲128M。指定併發hadoop作業中的地圖槽數
現在假設我有兩個工作:他們兩個都有很大的輸入文件,比如說一百G.我希望他們在hadoop系統中並行運行。 (因爲用戶不想等待,他們希望看到一些進展。)我希望第一個地圖插槽平行放置5個地圖插槽,第二個地圖插槽在其他3個地圖插槽上運行。有可能指定地圖插槽的數量嗎?目前我使用命令行啓動它作爲Hadoop jar jarfile classname輸入輸出。我可以在命令行中指定它嗎?
非常感謝您的幫助。
非常感謝。讓我先檢查一下 – user3034824