我是hadoop和豬的新手。我想知道如何運行一個內部調用UDF方法的豬腳本?事情是我沒有看到像豬UDF手冊上提及的聲明「註冊blah.jar」:用hadoop上的udf運行豬腳本
register myudfs.jar;
A = load 'student_data' as (name: chararray, age: int, gpa: float);
B = foreach A generate flatten(myudfs.Swap(name, age)), gpa;
C = foreach B generate $2;
D = limit B 20;
dump D;
但我確實看到一個包含「blah.jar」一個「罐子」目錄。我的同事已經離開了,所以我想知道這有什麼竅門?也許我可以將jar文件添加到命令行?
非常感謝!
您是否嘗試過運行該腳本?如果是這樣,你是否收到錯誤信息?被稱爲UDF的名稱是什麼? –
如果您可以回答@ WinnieNicklaus的問題,那將有助於我們理解問題的可能性。這個問題太多了。 – Dan
小熊和丹,我沒有試過運行腳本。因爲我實際上有兩個問題(或更多)。首先,我不確定我能夠如何生成myudfs.jar。所以在我的Mac上,我應該在eclipse上打開一個項目並添加豬的lib/jar,然後編寫UDF並將所有內容都包裝到myudfs.jar中?其次,在腳本中,我真的需要「註冊myudfs.jar」嗎?如果不是,豬如何找到罐子? – trillions