apache-pig

    0熱度

    1回答

    我在寫,因爲今天我遇到了一個問題,儘管到處搜索並嘗試了很多不同的陳述,但我無法以任何方式解決問題。 我有這個輸入文件: 3 {(car pen house glass)} 5 {(battery phone)} 6 {(the)} (我想澄清一下,因爲他們缺少我加「(」和「)」原始文件)。 我的目標是將這個文件(使用LOAD)加載到變量中並轉儲它(使用DUMP)。 我告訴我的企圖和它們的相

    0熱度

    1回答

    我在拉丁文中有一個關係。有很多列,所以我不想在加載關係時指定數據類型。事後有沒有辦法改變它? batters = LOAD 'hdfs:/home/ubuntu/pigtest/Batting.csv' using PigStorage(','); filtered_batters = FOREACH batters2 GENERATE $0 as id, $5 as bats; descri

    0熱度

    1回答

    我有表1與下面的模式來驗證列表 {客戶ID:INT,STOREID:INT,產品有:{(PRODID:INT,名稱:chararray)}} {:INT,客戶ID:INT,名稱:chararray UNIQUEID} 與下面的模式 客戶名單 店鋪列表與下面的模式 {UNIQUEID:INT,storeNum:INT,名稱:chararray}與模式 和產品列表 {UNIQUEID:INT,SKU:

    0熱度

    1回答

    我試圖讓我的豬的機器上運行,但每當我試圖啓動豬我得到以下錯誤: Exception in thread "main" java.lang.NoClassDefFoundError: org/apache/hadoop/mapred/JobConf at org.apache.pig.Main.run(Main.java:642) at org.apache.pig.Main.main(Main

    0熱度

    1回答

    我想要CONCAT在我的豬列如果某些條件得到匹配,我使用下面的代碼,但它是拋出錯誤。 CODE: STOCK_A = LOAD '/user/cloudera/pati1.hl7' USING PigStorage('|'); data = FILTER STOCK_A BY ($0 matches '.*OBR.*' or $0 matches '.*OBX.*'); MSH_DATA =

    0熱度

    1回答

    我對豬的訂單操作員有以下澄清。 任何人都可以澄清它。 示例代碼 x = LOAD '/home/hadoop/Desktop/HadoopSetup/input/Data/StockData' using PigStorage(',') As (exchange:chararray, symbol:chararray, date:chararray, open:double, high:doubl

    1熱度

    2回答

    嗨,我正在使用Pig將HBASE中的值移走。我試圖執行條件,如果它是成功的我會連接一個值,如果失敗我會連接前一行的值。 因爲我嘗試下面的代碼,但它不工作,並拋出錯誤。 代碼: STOCK_A = LOAD '/user/cloudera/pat.hl7' USING PigStorage('|'); data = FILTER STOCK_A BY ($0 matches '.*OBR.*' o

    0熱度

    1回答

    我寫了一個腳本豬: truck_events = LOAD '/user/data/truck_event_text_partition.csv' USING PigStorage(',') AS (driverId:int, truckId:int, eventTime:chararray, eventType:chararray, longitude:double, latitud

    0熱度

    2回答

    我有下面的示例 更新刪除重複對: OBR|1|METABOLIC PANEL OBX|1|Glucose OBX|2|BUN OBX|3|CREATININE OBR|2|RFLX TO VERIFICATION OBX|1|EGFR OBX|2|SODIUM OBR|3|AMBIGUOUS DEFAULT OBX|1|POTASSIUM 在此示例中考慮所有OBR作爲一個測試,

    0熱度

    1回答

    我有一個變量car_age在整個CSV文件中保存汽車的年齡的不同值。我如何取所有值的平均值?我需要用car_age值的平均值(或平均值)替換異常值。 這是我目前正在做的事情。 training_data= LOAD '/user/All_State_Insurance_Prediction_Dataset/sampled_training_dataset/sampled_training_set'