原來的map-reduce執行鏈是:InputSplits-->Mapper--> [Sorting/Shuffling, etc]-->Reducer-->...
如何修改Map-Reduce執行順序?
現在我不想輸入分割去映射器第一,但去其他一些新的階段,而不是(我們可以把它叫做預映射程序例如,這個類將由我自己創建)。
所以新的順序將是:InputSplits -> Pre-Mapper->Mapper ->...
我目前正在讀的源代碼。但是,我仍然無法找到任何線索(我應該碰到哪些課程)。
任何建議是值得歡迎的。非常感謝你:)
我從來沒有聽說過這門課。 我會更深入地看看它是否適合我的需求。非常感謝你:) –