我對sed的正則表達式有問題。看起來分組無法正常工作,我找不到原因。sed替代(s)分組不起作用
我嘗試這樣做,這個命令的許多衍生物:
sed -er "/s/^(\>[\w\d]+\=[\d]+)_.+\]_([\d])$/\1\2/" test.fa
此字符串(文件)[注意:在「>」通過這種形式中刪除,並且在每一個TRINITY
的前面,線被交替ID(>TRINITY
等)和序列(大寫字母,有星號)換行符( - >這裏空間)丟失]:
>TRINITY_DN41792_c0_g3_i1_len=553_path=[700:0-121_707:122-163_706:164-240_694:241-552]_[-1,_700,_707,_706,_694,_-2]_3 KMA
>TRINITY_DN41806_c0_g1_i1_len=213_path=[245:0-129_246:130-147_247:148-212]_[-1,_245,_246,_247,_-2]_1 NSIAP
>TRINITY_DN41806_c0_g1_i1_len=213_path=[245:0-129_246:130-147_247:148-212]_[-1,_245,_246,_247,_-2]_2 TQ*LHIL
>TRINITY_DN41806_c0_g1_i1_len=213_path=[245:0-129_246:130-147_247:148-212]_[-1,_245,_246,_247,_-2]_3 LNS
>TRINITY_DN41788_c0_g1_i1_len=188_path=[208:0-97_209:98-128_210:129-152_211:153-187]_[-1,_208,_209,_210,_211,_-2]_1
*KLCT
>TRINITY_DN41788_c0_g1_i1_len=188_path=[208:0-97_209:98-128_210:129-152_211:153-187]_[-1,_208,_209,_210,_211,_-2]_2 ENCA
>TRINITY_DN41788_c0_g1_i1_len=188_path=[208:0-97_209:98-128_210:129-152_211:153-187]_[-1,_208,_209,_210,_211,_-2]_3 KI
>TRINITY_DN41788_c0_g2_i1_len=167_path=[212:0-97_213:98-128_214:129-152_215:153-166]_[-1,_212,_213,_214,_215,_-2]_1
*KLCT
>TRINITY_DN41788_c0_g2_i1_len=167_path=[212:0-97_213:98-128_214:129-152_215:153-166]_[-1,_212,_213,_214,_215,_-2]_2 ENC
>TRINITY_DN41788_c0_g2_i1_len=167_path=[212:0-97_213:98-128_214:129-152_215:153-166]_[-1,_212,_213,_214,_215,_-2]_3 KIVH
>TRINITY_DN41788_c1_g1_i1_len=183_path=[154:0-182]_[-1,_154,_-2]_1 YGS
>TRINITY_DN41788_c1_g1_i1_len=183_path=[154:0-182]_[-1,_154,_-2]_2 TDPRTVP
>TRINITY_DN41788_c1_g1_i1_len=183_path=[154:0-182]_[-1,_154,_-2]_3 RIPGQF
我想擺脫中間的:「_path =」到最後'_'
我錯過了什麼?
看起來你並不標誌着你的問題回答沒有運氣,但已經放棄從我在評論閱讀本question--。我希望我的解決方案實際上有幫助,我似乎最近在這裏浪費時間。 – SaintHax