2
請幫我解決... 我在這上面花了很多時間。在豬中加載多個文件 - 擴展
我有一個文件夾中的文件,我希望他們根據他們的文件名的順序加載。
我甚至已經寫了Java代碼的擴展來轉換文件名以匹配以下鏈接中的指南中的格式。
- Load multiple files in pig
- Pig Latin: Load multiple files from a date range (part of the directory structure)
- http://netezzaadmin.wordpress.com/2013/09/25/passing-parameters-to-pig-scripts/
我使用豬11.0
在我script.pig,
set io.sort.mb 10;
REGISTER 'path_to/lib/pig/piggybank.jar';
data_ = LOAD '$input' USING org.apache.pig.piggybank.storage.XMLLoader('Data') AS (data_:chararray);
DUMP data_;
在外殼
[[email protected] currentfolder]# pig -x local script.pig -param input=/20131217/{1..10}.xml
返回錯誤:
[main] ERROR.org.apache.pig.Main - ERROR 2999: Unexpected error. Undefined parameter : input
嘗試指定「-param輸入= .. 。「在命令行中的」script.pig「之前。如果第一件事不起作用,請嘗試引用input =「...」 – Ruslan
您的解決方案可以正常工作! {1..10}部分除外。當我鍵入{1,2,3,4,5,6,7,8,9,10}但不是{1..10}時,它可以嗎?根據我所包含的第二個鏈接,它現在給出ERROR 2244現在爲 – FailedMathematician
,它表示擴展{1..10}是由Linux完成的,但不是由hdfs api完成的。任何建議或建議? – FailedMathematician