0
應用哈希這是有兩個部分一個問題:返回從蟒蛇UDF未知長度的元組,然後在豬
首先,我有一個創建未知長度的字符串列表蟒蛇UDF。 UDF的輸入是map
(python中的dict
),密鑰的數量基本上是未知的(這是我試圖獲得的)。
我不知道的是如何在一個模式中輸出它,讓我將它作爲列表(或其他可迭代的數據結構)返回。這是我到目前爲止:
@outputSchema("?????") #WHAT SHOULD THE SCHEMA BE!?!?
def test_func(input):
output = []
for k, v in input.items():
output.append(str(key))
return output
現在,問題的第二部分。一旦進入Pig,我希望爲我的所有用戶應用SHA散列到「列表」中的每個元素。有些豬僞代碼:因爲我想給SHA應用到每個元素在列表中,而不是整個列表
USERS = LOAD 'something' as (my_map:map[chararray])
UDF_OUT = FOREACH USERS GENERATE my_udfs.test_func(segment_map)
SHA_OUT = FOREACH UDF_OUT GENERATE SHA(UDF_OUT)
最後一行可能是錯誤的。