我有它的線是那樣的文件:刪除第一個標籤和最後一個分號之間的一切
EF457507|S000834932 Root;Bacteria;"Acidobacteria";Acidobacteria_Gp4;Gp4
EF457374|S000834799 Root;Bacteria;"Acidobacteria";Acidobacteria_Gp14;Gp14
AJ133184|S000323093 Root;Bacteria;Cyanobacteria/Chloroplast;Cyanobacteria;Family I;GpI
DQ490004|S000686022 Root;Bacteria;"Armatimonadetes";Armatimonadetes_gp7
AF268998|S000340459 Root;Bacteria;TM7;TM7_genera_incertae_sedis
我想打印第一個標籤和最後一個分號之間的任何事情,就像
EF457507|S000834932 Gp4
EF457374|S000834799 Gp14
AJ133184|S000323093 GpI
DQ490004|S000686022 Armatimonadetes_gp7
AF268998|S000340459 TM7_genera_incertae_sedis
我試圖使用正則表達式,但它不工作,有沒有辦法使用Linux,awk或Perl做到這一點?
當然有。你有什麼嘗試,什麼具體不符合你的嘗試? – mpe