這裏刪除的元組是我的代碼,爲我的問題:豬拉丁語中的數據包
a = LOAD 'tellers' using TextLoader() AS line;
# convert a to charrarry
b = foreach a generate (chararray)line;
# run through my UDF to create tuples
c = foreach b generate myudfs.TellerParser5(line); # ({(20),(5),(5),(10)(1),(1),(1),(1),(1),(5),(10),(10),(10)})....
d = foreach c generate flatten(number);
e = group d by number; #{group: chararray,d: {(number: chararray)}}
f = foreach e generate group, COUNT(d); # f: {group: chararray,long}
在databag女,我有一個空的元組(1)我想過濾/刪除。
dump f;
(,1)
(1,97)
(5,49)
(10,87)
(20,24)
describe f;
f: {group: chararray,long}
我已經試過這沒有成功(不作任何改變):
remove_tuple = filter f BY group is not null;
如何更改元組名稱?爲什麼它是「組」是我創建數據包「e」的方式。所以上面爲我編輯的代碼。 – jKraut
在第一個腳本本身中更改「e」並嘗試..... U不應該在任何地方使用關鍵字作爲元組名稱.... – madhu