我有存儲在一個元組:現在如何存儲和使用可變豬
T: {long}
:
{group: chararray,word_count: long}
所以,我總結所有WORD_COUNT變量,並將其存儲在一個變量T ,我有一個變量X,看起來像:
(word1,12,word1,1)
(word2,22,word2,4)
(word3,32,word3,14)
我需要做數學運算1,4,14人反對存儲在T, 價值,但我的每一個都不識別T.
result = FOREACH X GENERATE $3*T;
失敗。它不承認T,因爲在十沒有字段稱爲T
所以,我所做的是,我越過X和T TEMP = CROSS X,T
這是正確的方式??我是新來的豬。我的解決方案似乎不是很優雅。
非常感謝你!我是PIG和hadoop的初學者。你推薦的任何好書可能? – user2773013
查看O'Reilly的書「編程豬」。 –