我在許多子目錄中有許多文件,所有文件都以逗號分隔。我想通過組第一場中的每個文件並運行記錄總數由多個文件組成
A = LOAD '/files/*' USING PigStorage(',') as (f1, f2, f3, f4, f5);
B = GROUP A ALL;
C = GROUP B BY f1;
D = FOREACH C GENERATE COUNT(f1) ;
DUMP D;
這段代碼給了我我錯誤
無效場投影。計劃字段[f1]在模式中不存在:group:chararray,A:bag {:tuple(f1:chararray,f2:bytearray,f3:bytearray,f4:bytearray,f5:bytearray)}。
謝謝!那就是訣竅。 – Jimmy