我在某些使用案例中一直沒有使用減速機作業,但是我從未遇到過「無映射器」作業。 「沒有Mapper」意味着mapreduce框架仍然會讀取輸入文件並以某種方式對它們進行排序/排序(基於InputFormat?),這些將成爲我的reducer的輸入?何時會需要「無映射器」?
2
A
回答
5
「無映射器」是「身份映射器」的委婉語。默認的映射器,如果你沒有指定一個就是這樣。至少,身份映射程序將未改變的輸入引導至右縮減分區。
1
對於基於輸入密鑰的一些聚合函數,身份映射器是有意義的。映射器將發出與輸入相同的I/O鍵,並且reducer將聚合特定鍵的值。
1
如果您在使用Hadoop的流:
-mapper "/bin/sh -c \"cat\""
相關問題
- 1. Hibernate註解映射比hbm.xml映射需要更多的時間
- 2. 是否需要映射器接口
- 3. 通過哈希映射映射,需要返回哈希映射
- 4. web2py - 格式需要映射?
- 5. 需要ntdll.dll映射文件
- 6. 需要Hibernate映射嗎?
- 7. KnockoutJS映射 - 只需填寫我需要的服務器
- 8. 如何編碼需要任意映射器的螞蟻任務?
- 9. 自動映射器會議
- 10. 要求映射:映射擴展時獲取模塊超時
- 11. 需要所有請求映射url
- 12. 我需要映射文件嗎?
- 13. 類型錯誤:格式需要映射
- 14. Spring集成 - 需要映射SOAP頭
- 15. MFC的消息映射,不需要&?
- 16. FluentNHibernate映射語法幫助需要
- 17. 需要一些休眠關係映射
- 18. 的std ::映射更比需要對比
- 19. ElasticSearch NEST手動映射需要分析
- 20. 需要幫助w/NFLuent休眠映射
- 21. Android:getOrientation()是否需要連續重映射?
- 22. HttpHandler是否需要一個aspnet_isapi.dll映射
- 23. 需要採取協調從表映射
- 24. 需要加速自動映射器...它需要32秒做113個對象
- 25. 如何對象映射器時間戳映射到最新
- 26. POJO無需JSON字符串映射
- 27. NHibernate - 無需映射即可加入
- 28. 需要SqlAlchemy單表繼承的經典映射器示例
- 29. 僞分佈式:需要更改映射器節點的數量
- 30. 需要多個數據映射器的域對象