獲得最大的價值我有一個看起來像這樣的製表符分隔的fileA:的bash/awk的:每個細胞
seqnameAa_len_240 seqnameBa_len_247
seqnameAb_len_881 seqnameBb_len_719
seqnameAc_len_736,seqnameAd_len_640 seqnameBc_len_489
seqnameAe_len_241 seqnameBd_len_302,seqnameBe_len_465
seqnameAf_len_436,seqnameAf_len_620 seqnameBf_len_452,seqnameBg_len_435
序列左邊是從一個數據集和序列從右邊是從另一個。每一行反映了一組相似的序列。在某些情況下,屬於同一序列組的一個,另一個或兩個數據集有多個序列(反映在一列中用逗號分隔的幾個序列中)。
對於每一行,我想找到一種方法來找到兩個數據集中每個數據集的最大值,並給出以下輸出。
240 247
881 719
736 489
241 465
620 452
我想過做一個for循環在所有的行,然後對每行以換行符替換逗號,然後刪除所有的文本,並只保留號碼,並選擇每列使用awk的最大值。但是用我現在的bash/awk知識必須按列方式完成,並且每個單元沒有一定數量的逗號分隔條目,我不知道該怎麼做。
是否有一種更簡單的方式從fileA獲取上述輸出?
不要猶豫,嘗試自己編碼並顯示你的嘗試。否則,你很可能會習慣於完成任務,當你需要自己完成任務時,你將不會學到任何東西。 – fedorqui 2015-02-24 15:30:38