我有一個名爲data
文件看起來像這樣:Apache的豬不能解析的元組完全
personA (1, 2, 3)
personB (2, 1, 34)
(注意,是「PERSONA」之後的製表),我有這樣一個Apache豬腳本:
A = LOAD 'data' AS (name: chararray, nodes: tuple(a:int, b:int, c:int));
C = foreach A generate nodes.$0;
dump C;
輸出其中有意義的:
(1)
(2)
但是如果我改劇本的模式是這樣的:
A = LOAD 'data' AS (name: chararray, nodes: tuple());
C = foreach A generate nodes.$0;
dump C;
然後輸出我得到的是這樣的:
(1, 2, 3)
(2, 1, 34)
它看起來像該元組中的第一個(也是唯一一個)元素是一個字節陣列。即它不會將輸入文本1, 2, 3
解析爲元組。
未來我的輸入將有一個未知的&變量數nodes
項中的元素,所以我不能只寫出a:int, …
。
無論如何讓Pig將輸入元組解析爲一個元組而不必寫出完整的模式?