分裂數我有點困惑與Page 112 of the Book Map Reduce Design模式在totalOrderPartitioner
注意範圍的中間分區數量需要 等於減速器的順序步驟數給出本說明。如果您決定 變化減速器的數量和你一直重複使用相同的文件, 你需要重建它
對於初學者來說,我不能完全確定什麼「中間分區」是指這種情況下,有人可以用一個例子解釋一下吧..
也是本書不下去了來解釋這一要求的原因,我猜測原因是
這傳遞每個中間分隔到減速器可以並行處理所有分區,因此效率最高......
但是爲了參數的緣故,如果我對低效率沒問題,我可以把任意數字作爲reducer的數量嗎?會不會以任何方式影響最終輸出(比其他性能)
你一直在重複使用相同的文件, 你需要重建它**
什麼上面的兩行表示?
感謝,關鍵帶走的我是,InputSampler使用,我們在工作中設置來確定要創建的分區數目,沒有哪裏程序員決定多少分區應創建減速器的數量,我們只能指定如何創建分區 – Sudarshan