2016-06-16 22 views
1

我是新手在豬上工作。我曾經遇到過一個問題在處理XML文件,下面的命令我用什麼:無法在豬中處理Xml

register '/usr/lib/pig-0.12.0/contrib/piggybank/java/piggybank.jar' 
pigdata = load '/xml1.xml' using org.apache.pig.piggybank.storage.XMLLoader('name') as (doc:chararray); 

values = foreach pigdata GENERATE FLATTEN(REGEX_EXTRACT_ALL(doc,'<name>(.*)</name>')) AS (name:chararray); 

dump values; 

Screen shot of error encountered

回答

0

此問題可能是由於文件路徑的問題和/或權限問題。您可以檢查輸入文件的hdfs文件路徑是否存在於/user/edureka/xml1.xml。你也可以手動檢查你是否能夠在hdfs:// localhost:8020/tmp目錄等中創建新文件來排除權限問題。