0
如果我有一個ID重複行,查找重複
我可以使用蜂巢與follwoing查詢
create table dupe as select * from table1 group by id having count(*) > 1;
我們可以執行使用豬相同功能的查找表?
如果是的話,有人可以幫助我嗎?
如果我有一個ID重複行,查找重複
我可以使用蜂巢與follwoing查詢
create table dupe as select * from table1 group by id having count(*) > 1;
我們可以執行使用豬相同功能的查找表?
如果是的話,有人可以幫助我嗎?
以下代碼可以幫助您:
r1 = load ...;
r2 = group r1 by id;
r3 = foreach r2 generate COUNT(r1) as c, r1;
r4 = filter r3 by c > 1;
r5 = foreach r4 generate FLATTEN(r1);
dump r5;
然而,爲了不保留。
你可以使用rank函數,然後在最後按順序排列,以便保持集合的順序 –