我有一個文件test_file_1.txt
包含:含PigLatin - 將數據插入現有分區?
20140101,value1
20140102,value2
和文件test_file_2.txt
:
20140103,value3
20140104,value4
在HCatalog有一個表:
create table stage.partition_pk (value string)
Partitioned by(date string)
stored as orc;
這兩個腳本的工作很好:
Sc RIPT 1:
LoadFile = LOAD 'test_file_2.txt' using PigStorage(',') AS (date : chararray, wartosc : chararray);
store LoadFile into 'stage.partition_pk' using org.apache.hcatalog.pig.HCatStorer();
腳本2:
LoadFile = LOAD 'test_file_2.txt' using PigStorage(',')
AS (date : chararray, wartosc : chararray);
store LoadFile into 'stage.partition_pk' using org.apache.hcatalog.pig.HCatStorer();
表partition_pk
包含四個分區 - 一切都如預期。
但讓我們說,還有另一個文件包含應該插入到一個現有分區中的數據。 Pig無法寫入包含數據的分區(或者我錯過了某些內容?) 如何管理加載到現有分區(不是空的非分區表)? 您是否閱讀分區,將其與新數據聯合,刪除分區(如何?)並將其作爲新分區插入?
Thans爲您的答案。你寫道:_Basically,它看起來像如果你不想使用動態分區,那麼0.13可能適合你。你只需要記住設置適當的屬性。你的意思是哪個參數?哪個bug解決了我的問題?謝謝 –
我更新了我的答案,以包含適用於我的解決方法。 – user2370813
感謝你與其他分區。你有沒有檢查過這個分區是否會影響桌面?它是不是沉沒了休息時間? –