2014-07-22 77 views
1

我需要在PDI(壺)中GroupBy和MergeJoin。兩者都使用與密鑰相同的字段。我是否需要在合併之前進行排序

我無法在任何地方確認GroupBy數據的排序後。

在情況下,我需要知道,如果這將是正確的: SORT> GROUPBY> SORT> MERGEJOIN 或 SORT> GROUPBY> MERGEJOIN

有人能告訴我什麼是正確的,爲什麼?

非常感謝。

回答

1

您需要根據您要分組或加入的密鑰對分組依據和合並加入進行排序。關於退出的數據將具有與以前相同的順序,因此,如果您根據相同的鍵進行分組然後合併,則不需要Group by和Merge Join之間的排序。

但是,如果鍵改變了,

+0

謝謝你nsousa。 –

相關問題