1
5063005905|06776|0|1
5063005905|06776|1|16
5063005905|06776|2|59729
4999999999|Z9991|2|119
文件2
5063005905|Z9992|0|59730
5063005905|Z9992|1|16
4999999999|Z9991|2|121
4999999999|Z9991|2|122
遍歷文件1對1列和基於列的1千萬查找的文件2,在一個行合併線。這裏5063005905在file1中是3次,但在文件2中只有2次,所以一個將是null,另外兩個應該映射。
同樣4999999999是一次file1中但在兩次文件2.
輸出所需
5063005905|06776|0|1 : null
5063005905|06776|1|16 : 5063005905|Z9992|1|16
5063005905|06776|2|59729 : 5063005905|Z9992|0|59730
4999999999|Z9991|2|119 : 4999999999|Z9991|2|121
Null: 4999999999|Z9991|2|122
我用以下
while read x
do
ppt=`echo $x |cut -d'|' -f1`
grep -w $ppt file2|while read -r line ;do
echo "$x:$line"
done<file1
這兩個數字在兩個文件中的排列順序是否始終相同?它們總是聚集在一起還是隨機排列? – Noctua
訂單將是隨機的。我們需要查看。 – Ash
File1有3個5063005905的實例,而File2只有2個實例。實例應該如何映射,或者無關緊要? –