2016-03-15 72 views
-1

我有兩個文件。一個文件具有數據如下豬交叉加入和替換

Ram,C,Bnglr 
Shyam,A,Kolkata 

的另一個文件是具有參考

C,Calicut 
A,Ahmedabad 

現在用的豬,我要搜索並替換原始文件中的數據來創建一個新的文件,這樣我可以使用這兩個文件創建一個新文件。

Ram,Class,Bnglr 
Shyam,Ahmedabad,Kolkata 

豬有可能。我知道如何在MR中做到這一點,但想在豬身上嘗試。

回答

1

Yes.Join的文件,並選擇所需的列,並寫入新文件

A = LOAD 'file1.txt' AS (a1:chararray,a2:chararray,a3:chararray); 
B = LOAD 'file2.txt' AS (b1:chararray,b2:chararray); 
C = JOIN A BY a2, B BY b1; 
D = FOREACH C GENERATE A::a1,B::b2,A::a3; 
STORE D INTO 'file3.txt' 
0

上面的邏輯將工作,但如果你沒有在這種情況下,在第二個文件匹配的記錄,你會錯過來自檔案1的記錄