所以這個問題困擾着我,我還有一百萬個其他項目要去,所以我希望能夠清楚這一點。到目前爲止,我還沒有找到答案。看起來很簡單。我用:
awk '$1' merged_counts.txt |sort|uniq -d|wc
並得到了216行。但是,這個數字是不正確的。如果我用
more merged_counts.txt|cut -f 1|sort|uniq -d|wc
我得到271行,這是正確的。如果我使用
awk '{print $1}' merged_counts.txt |sort|uniq -d|wc
我也得到271行,但是,那麼我也失去了其餘的領域。我無法弄清楚爲什麼它看起來像是一件基本的事情。感謝您的任何幫助/建議。當然,我必須俯視一些東西。文件的
實施例:
B3GALT1 72 128 65 124 87 118 102 117 38 106 87 115 27 20 89 30
AMY1A 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0
PSENEN 654 459 648 462 508 399 537 532 696 460 625 473 621 322 633 434
基因「AMY1A」是在兩個DNA鏈註釋所以它在我的文件中出現兩次的那些基因中的一個。
順便說一句,我的問題是爲什麼我得到216和271.我知道使用awk打印將擺脫其餘的領域。謝謝! – user2937872
您正在使用'more'(一個交互式程序),您應該使用'cat',或者甚至更好'cut -f 1
chepner
我的壞習慣。我腦子裏的某些東西只允許我使用貓,如果我真的要連接某些東西的話。 – user2937872