如果一個人有這樣的數據:自豬交叉聯接被忽略
A = LOAD 'data' AS (a1:int,a2:int,a3:int);
DUMP A;
(1,2,3)
(4,2,1)
然後一個交叉聯接被做在A上,A:
B = CROSS A, A;
DUMP B;
(1,2,3)
(4,2,1)
爲什麼是第二一個優化從查詢中取出?
信息:豬版0.11
== == UPDATE
如果我排序,如:
C = ORDER A BY a1;
D = CROSS A, C;
它會給一個正確的交叉聯接。
是因爲框架的數據流性質嗎? – 2013-03-06 20:00:02
這是因爲背景中產生的map-reduce作業的類型:但是您執行連接時,需要兩個單獨的輸入。 – davek 2013-03-06 20:10:07