我有一個這樣的文件:篩選幾列
[1]CHROM [2]POS [3]REF [4]ALT [5]GT_MA [6]GT_PA [7]GT_HI
1 13380 C G 0/1 0/1 0/1
1 13504 G A 0/0 0/0 0/0
1 17361 T * ./. 0/0 0/0
1 17365 C G ./. 0/0 0/0
1 17373 A G 0/0 ./. 0/0
1 17375 A G 0/1 0/1 1/1
1 17378 C T 1/1 0/1 1/1
1 17379 G A 0/0 ./. 0/0
1 17385 G A 0/0 ./. 0/0
1 17398 C A ./. ./. ./.
1 17403 A G 0/0 ./. ./.
1 17406 C T 0/0 ./. ./.
1 17407 G A 0/0 ./. ./.
1 17408 C G 0/0 ./. ./.
1 17452 C T 0/0 0/0 0/0
1 17478 C T 0/0 0/0 0/0
1 17479 G A 0/0 0/0 0/0
1 17483 C T 0/0 0/0 0/0
1 17484 G A 0/1 1/1 1/1
15 52640990 TAA TAAA,TAAAA,TA,T,TAAAAA 1/3 1/1 0/1
15 72252189 TAAA TAAAA,TAA,T,TAAAAA,TA,TAAAAAA 0/0 0/1 1/2
我想提取$ 5,$ 6及$ 7值的不同組合的所有行。例如$ 5 = 0/1,$ 6 = 0/1,$ 7 = 0/1; $ 5 = 0/1,$ 6 = 0/1,$ 7 = 1/1; $ 5 = 1/1,$ 6 = 0/1,$ 7 = 1/1和$ 5 = 1/1。
預期輸出:
[1]CHROM [2]POS [3]REF [4]ALT [5]GT_MA [6]GT_PA [7]GT_HI
1 13380 C G 0/1 0/1 0/1
1 17375 A G 0/1 0/1 1/1
1 17378 C T 1/1 0/1 1/1
1 17484 G A 0/1 1/1 1/1
我試圖做這樣一個單獨的過濾沒有結果。
awk -F '\t' '{ if(($5 = 0/1) && ($6 =0/1) && ($7 = 0/1)) { print }}' file1 > file2out
我不確定是否可以使用awk來做到這一點。謝謝你的幫助!
您的樣本現在是否包含您已獲得2個答案失敗的行? –