apache-pig

    0熱度

    1回答

    我有下面的單個原始文件,並且需要將文件拆分成不同的關係。 如果線的起點爲0,完整的行應轉到關係「標題」 如果行開頭1,完整的行應轉到關係「禁止」 如果行開頭2,完整的行應轉到關係「子」 如果符合3開始,完整的行應轉到關係「項目」 如果符合4開始,完整的行應轉到關係「稅」 0ALH 012012050104.00.00356.0012.06001 1980377362 HAW R 1200100

    1熱度

    1回答

    我正在嘗試編寫一個過濾器UDF,它將輸入作爲元組,並返回元組,但是當我在Gruntt shell中定義函數時,我得到錯誤消息解析失敗,我在哪裏做錯了這裏 REGISTER /home/filterUDF.jar; DEFINE filDist 'FilterDistrictUdf/FilterDistrict' package FilterDistrictUdf; import ja

    0熱度

    1回答

    這是一個基本的PIG問題。 我有我的數據是這樣的 10 | Dog 15 | Cow 20 | Dog 15 | Elephant 15 | Dog 25 | Elephant 我想要找的平均重量每隻動物的,並具有輸出,因爲這: Dog | 12.5 Elephant | 20 Cow | 15 我能夠通過使用GROUP和得到的結果,但結果是一個袋子,像這樣: {(Dog),

    0熱度

    1回答

    我有以下方式的一些數據: (102,(727,103,895)) (102,(105,255)) 有誰知道如何在豬這些數據轉換爲下面的方式? (102,727) (102,103) (102,895) (102,105) (102,255)

    0熱度

    2回答

    我想在豬中執行以下命令 7369,SMITH,CLERK,800.00,null,20 7499,ALLEN,SALESMAN,1600.00,300.00,30 腳本 emp_bag = LOAD '/home/training/dvs/emp.csv' using PigStorage(',') AS (eno:int, ename:chararray, job:chararray, s

    0熱度

    1回答

    可以說:我有一個與蜂巢結構相關的表。我可以通過這個表格數據創建一個豬模式嗎?將蜂房查詢和豬模式 - 兩者都可行嗎?

    1熱度

    1回答

    那麼我如何從下列輸入中獲取豬的這個輸出。該命令我應該使用 輸入: 10/3/2013 1200 10/4/2013 0000 預期輸出: Monday Morning Tuesday Evening

    0熱度

    1回答

    運行豬腳本時出現錯誤2017-10-29 03:34:22,212 [main] ERROR org.apache.pig.tools.grunt.Grunt - ERROR 1200: <line 6, column 13> Syntax error, unexpected symbol at or near ''/home/harsh/Hunny/HadoopPractice/Pig/Uppe

    0熱度

    2回答

    我是Hadoop和pig的新手。根據問題我能夠深入研究,直到下面的腳本,但我怎麼能比較個人的薪水與他的部門的平均工資。以下是寫入得到各部門的平均工資腳本 A = LOAD 'Assignment_1_Input.log' USING PigStorage('\t') as (id:int,name:chararray,age:int,salary:int,deptid:int); B = GRO

    -2熱度

    1回答

    豬的SQL等級select * from表名