我有一個數據幀DF如下所述:獲取星火重複的記錄
**customers** **product** **val_id** **rule_name** **rule_id** **priority**
1 A 1 ABC 123 1
3 Z r ERF 789 2
2 B X ABC 123 2
2 B X DEF 456 3
1 A 1 DEF 456 2
我想創建一個新的數據幀DF2,這將只有唯一客戶ID,但作爲RULE_NAME和RULE_ID列在數據同一客戶不同的,所以我要選擇哪些具有最高優先級相同客戶那些記錄,所以我的最終結果應該是:
**customers** **product** **val_id** **rule_name** **rule_id** **priority**
1 A 1 ABC 123 1
3 Z r ERF 789 2
2 B X ABC 123 2
任何人都可以請幫助我使用Spark Scala實現它。任何幫助都會被矇蔽。