1
我需要在PDI(壺)中GroupBy和MergeJoin。兩者都使用與密鑰相同的字段。我是否需要在合併之前進行排序
我無法在任何地方確認GroupBy數據的排序後。
在情況下,我需要知道,如果這將是正確的: SORT> GROUPBY> SORT> MERGEJOIN 或 SORT> GROUPBY> MERGEJOIN
有人能告訴我什麼是正確的,爲什麼?
非常感謝。
我需要在PDI(壺)中GroupBy和MergeJoin。兩者都使用與密鑰相同的字段。我是否需要在合併之前進行排序
我無法在任何地方確認GroupBy數據的排序後。
在情況下,我需要知道,如果這將是正確的: SORT> GROUPBY> SORT> MERGEJOIN 或 SORT> GROUPBY> MERGEJOIN
有人能告訴我什麼是正確的,爲什麼?
非常感謝。
您需要根據您要分組或加入的密鑰對分組依據和合並加入進行排序。關於退出的數據將具有與以前相同的順序,因此,如果您根據相同的鍵進行分組然後合併,則不需要Group by和Merge Join之間的排序。
但是,如果鍵改變了,
謝謝你nsousa。 –