0
假設我們有一個RDD rddBefore
,在某些映射操作後變爲rddAfter
。一個分區partitionBefore
在rddBefore
對應於partitionAfter
在rddAfter
。分區在RDD.zip()操作之後分佈在哪裏
由於火花可能在計算過程中降低地域性,因此partitionBefore
和partitionAfter
可以分佈在不同的機器上,比如m1
和m2
。
rddBefore.zip(rddAfter)
之後,哪臺機器將(partitionBefore, partitionAfter)
分配到?
感謝