2012-12-21 66 views
1

我有兩個文件。我想順序合併它。我如何使用Pig/PigLatin腳本來做到這一點?如何使用PIG腳本合併兩個文件?

f1.csv 
1,aa 
1,aa 
1,ab 
1,ac 
2,bd 
2,bd 
2,bd 
4,ab 
4,bc 

f2.csv 
1,xxx 
1,xxy 
1,xyx 
1,yxx 
1,xyy 
1,yyx 
2,pqr 
2,pq 
2,pqrs 
2,pqs 
3,def 

和輸出我需要的是

1,aa,1,xxy 
1,aa,1,xyx 
1,ab,1,yxx 
1,ac,1,xyy 
2,bd,2,pqr 
2,bd,2,pq 
2,bd,2,pqrs 

誰能幫助我該加入應使用以及如何獲得呢?

+1

http://pig.apache.org/docs/r0.10.0/basic.html#join-inner - 我認爲這個例子幾乎涵蓋了它,但是你的預期輸出將會有第一場配對的每個組合 - 你似乎在要求有些不同,或者你的預期產出是不完整的? (將有24配對的第一個字段值1) –

+0

我認爲這將需要一個自定義輸入格式 –

+0

請解釋更多。 '1,xxx'等等發生了什麼?你的(精神)算法是什麼? –

回答