2014-05-08 66 views
1

我有一個使用lxml的Python UDF。使用該UDF我的豬作業失敗:Pig Python UDF和lxml

File "PigParse.py", line 10, in ParseToPig ImportError: No module named lxml 

的Python腳本工作正常,作爲一個獨立的程序,它的第10行是:

from lxml import etree 

我需要LXML莫名其妙地分發到Hadoop集羣如果是這樣,我應該如何使用以及使用哪個版本?

我見過使用 Hadoop文件 分發nltk的例子,但對於Pig沒有任何意義。

TIA !!!

回答