兩個文件我張貼的問題,一個星期前,得到的答案是簡單的(使用連接):加入基於兩個領域
join <(sort file1) <(sort file2) >output
加入有共同的東西通常是第一個字段的文件。
我有以下兩個文件:
genes.txt
ENSG001 ENSG002
ENSG002 ENSG001
ENSG003 ENSG004
features.txt
ENSG001 400
ENSG002 350
ENSG003 210
ENSG004 100
我需要加入這兩個文件是這樣的:
output.txt
ENSG001 400 ENSG002 350
ENSG002 350 ENSG001 400
ENSG003 210 ENSG004 100
我知道答案是在聯接命令,但我不知道如何加入基於兩個領域。我試圖
join -j 1 <(sort genes.txt) <(sort features.txt) >attempt1.txt
但結果會看起來像這樣:
attempt1.txt
ENSG001 ENSG002 400
ENSG002 ENSG001 350
ENSG003 ENSG004 210
我又試圖
join -j 2 <(sort -k 2 genes.txt) <(sort -k 2 features.txt) >attempt2.txt
attempt2.txt是空的
(連接)是否可以根據兩個字段連接兩個文件?如果沒有,那我該怎麼辦呢?
在features.txt中ENST應該是ENSG,也許? – igustin 2012-07-22 11:40:06
這個問題爲什麼用'Perl'標記?你正在問一個關於'join'的問題。 – Borodin 2012-07-22 14:03:06
是的,這是ENSG不ENST – 2012-07-22 20:03:17