1
我有一個使用lxml的Python UDF。使用該UDF我的豬作業失敗:Pig Python UDF和lxml
File "PigParse.py", line 10, in ParseToPig ImportError: No module named lxml
的Python腳本工作正常,作爲一個獨立的程序,它的第10行是:
from lxml import etree
我需要LXML莫名其妙地分發到Hadoop集羣如果是這樣,我應該如何使用以及使用哪個版本?
我見過使用 Hadoop文件 分發nltk的例子,但對於Pig沒有任何意義。
TIA !!!