我使用PigLatin。我想刪除從袋的重複並希望保留特定鍵的最後一個元素。刪除重複使用PigLatin和留住最後一個元素
Input:
User1 7 LA
User1 8 NYC
User1 9 NYC
User2 3 NYC
User2 4 DC
Output:
User1 9 NYC
User2 4 DC
這裏第一個字段是關鍵字。我想保留在輸出該特定鍵的最後一個記錄。
我知道如何保持第一要素。如下所示。但不能保留最後一個元素。
inpt = load '......' ......;
user_grp = GROUP inpt BY $0;
filtered = FOREACH user_grp {
top_rec = LIMIT inpt 1;
GENERATE FLATTEN(top_rec);
};
有人能幫助我嗎?提前致謝!
尼斯方法.. –
酷!這是一個完美的解決方案。感謝你的回答。 –