我有一個包含HDFS數據的.TSV文件,我無法將它加載到Pig中。 我使用的命令是「如何從.tsv文件加載Pig中的數據?
A = load 'file_location' as (name:chararray, age:int, gpa:float);
B = foreach A generate (name, age);
DUMP B;
返回錯誤:無法找到運營商別名
我有一個包含HDFS數據的.TSV文件,我無法將它加載到Pig中。 我使用的命令是「如何從.tsv文件加載Pig中的數據?
A = load 'file_location' as (name:chararray, age:int, gpa:float);
B = foreach A generate (name, age);
DUMP B;
返回錯誤:無法找到運營商別名
不喜歡它/ /文件的這一
A = load「的路徑'使用PigStorage('\ t')AS(name:chararray,age:int,gpa:float);
B = foreach生成名稱,年齡;
DUMP B;
ps:我不認爲你的命令有任何問題。標籤(\ t)是pig的默認分隔符。我正在用你的命令得到正確的輸出結果。請給我發送你的終端的日誌或截圖。
如果不指定分隔符PIG使用默認','作爲加載文件的分隔符。因此您的加載語句失敗。您必須明確指定分隔符'\ t'。
A = LOAD 'file_location' USING PigStorage('\t') AS (name:chararray, age:int, gpa:float);
感謝您的幫助 – rajshukla4696
豬的默認分隔符是'\ t'。你可以自己嘗試。 –
感謝您的幫助,它的工作。 – rajshukla4696