2016-09-16 51 views
0

我有一個輸入A,我將其轉換爲散佈在羣集中的rdd X火花處理數據混洗嗎?

我對它執行某些操作。

然後我在輸出rdd上做.repartition(1)

我的輸出rdd是否與輸入A的順序相同。

火花會自動處理這個嗎?如果是,那麼如何?

+0

會是什麼你做到了嗎?爲什麼要將數據重新分區到單個分區? –

+0

@YuvalItzchakov必須在單個文件中打印輸出。 – Azrael

回答