0
我是編程界的新手,我正在學習Hadoop。在寫豬查詢時,我得到了意想不到的輸出結果。我試過的查詢是我通過在PIG中執行JOIN操作來發生錯誤?
D = LOAD 'data1' AS (a:int,b:int);
S = LOAD 'data2' AS (c:int,d:int);
J = JOIN D by a, S by c;
DUMP J;
我插入outup和數據集。我的要求是隻獲得數據1和第一列數據2(組合)的第一欄,但我得到了低於
我無法插入我想要的方式。
O/P:
(1,2,1,3)
(4,3,4,9)
(4,3,4,6)
(4,2,4,9)
(4,2,4,6)
(8,3,8,6)
(8,3,8,9)
數據組:
數據1:
1 2
4 2
8 3
4 3
7 2
8 4
數據2:
2 4
8 9
1 3
2 7
2 9
4 6
4 9
數據集中的數據不在一行中,即1和2將在第1行中具有/ t空間,然後4和2將在另一行中具有/ t空間,等等。我無法以我想要的方式插入。 – user2815076
您將加入2欄的2列....您爲什麼期望小於4? –