apache-pig

0熱度

1回答

我有下面的單個原始文件，並且需要將文件拆分成不同的關係。如果線的起點爲0，完整的行應轉到關係「標題」如果行開頭1，完整的行應轉到關係「禁止」如果行開頭2，完整的行應轉到關係「子」如果符合3開始，完整的行應轉到關係「項目」如果符合4開始，完整的行應轉到關係「稅」 0ALH 012012050104.00.00356.0012.06001 1980377362 HAW R 1200100

1熱度

1回答

豬錯誤：解析查詢失敗

我正在嘗試編寫一個過濾器UDF，它將輸入作爲元組，並返回元組，但是當我在Gruntt shell中定義函數時，我得到錯誤消息解析失敗，我在哪裏做錯了這裏 REGISTER /home/filterUDF.jar; DEFINE filDist 'FilterDistrictUdf/FilterDistrict' package FilterDistrictUdf; import ja

0熱度

1回答

PIG集團避免袋

這是一個基本的PIG問題。我有我的數據是這樣的 10 | Dog 15 | Cow 20 | Dog 15 | Elephant 15 | Dog 25 | Elephant 我想要找的平均重量每隻動物的，並具有輸出，因爲這： Dog | 12.5 Elephant | 20 Cow | 15 我能夠通過使用GROUP和得到的結果，但結果是一個袋子，像這樣： {(Dog),

0熱度

1回答

變換具有多個字段的數據在豬

我有以下方式的一些數據： (102,(727,103,895)) (102,(105,255)) 有誰知道如何在豬這些數據轉換爲下面的方式？ (102,727) (102,103) (102,895) (102,105) (102,255)

0熱度

2回答

慶典：靠近意外的標記'（」語法錯誤 - 豬，CentOS的

我想在豬中執行以下命令 7369,SMITH,CLERK,800.00,null,20 7499,ALLEN,SALESMAN,1600.00,300.00,30 腳本 emp_bag = LOAD '/home/training/dvs/emp.csv' using PigStorage(',') AS (eno:int, ename:chararray, job:chararray, s

0熱度

1回答

蜂房和豬在相同的數據集上

可以說：我有一個與蜂巢結構相關的表。我可以通過這個表格數據創建一個豬模式嗎？將蜂房查詢和豬模式 - 兩者都可行嗎？

1熱度

1回答

將日期轉換爲星期名稱和當天的部分時間

那麼我如何從下列輸入中獲取豬的這個輸出。該命令我應該使用輸入： 10/3/2013 1200 10/4/2013 0000 預期輸出： Monday Morning Tuesday Evening

0熱度

1回答

在豬中使用UDF時出現錯誤1070

運行豬腳本時出現錯誤2017-10-29 03:34:22,212 [main] ERROR org.apache.pig.tools.grunt.Grunt - ERROR 1200: <line 6, column 13> Syntax error, unexpected symbol at or near ''/home/harsh/Hunny/HadoopPractice/Pig/Uppe

0熱度

2回答

如何獲得薪水高於其部門平均水平的員工的姓名和部門？

我是Hadoop和pig的新手。根據問題我能夠深入研究，直到下面的腳本，但我怎麼能比較個人的薪水與他的部門的平均工資。以下是寫入得到各部門的平均工資腳本 A = LOAD 'Assignment_1_Input.log' USING PigStorage('\t') as (id:int,name:chararray,age:int,salary:int,deptid:int); B = GRO

-2熱度

1回答

豬的SQL等級select * from表名