我想使用第一行的一些信息重命名一些基因組FASTA文件,但我無法弄清楚。用第一行的一部分重命名FASTA文件
下面是一個例子,有兩個文件:
GCA_000007365.1_ASM736v1_genomic.fna
:
>AE013218.1 Buchnera aphidicola str. Sg (Schizaphis graminum), complete genome
ATGTCAAAGTCGTATTTAAAAAATTTTGATGTTATTGTTATTGGTGGAGGGCATGCTGGCACTGAAGCTGCAGCAGCCTC
TGCAAGAGTAGGTTGTAAAACATTATTATTAACTCAAAAAATAACTGATATAGGTGTATTATCTTGCAATCCTGCTATCG
GCA_000012065.2_ASM1206v2_genomic.fna
:
>CP000048.1 Borrelia hermsii DAH, complete genome
TACCACTACACTTATTAATAATACATACTCACGCCTGGGGGGAAAAATTCAATAATGGAAACCTTACAAATATAAAACCA
CTACAAATAGGTATTATTCAGCATAATTATATAAATTTAACTCCTTATAATCAACATTATAAATATTACGCTTTCATTGG
我想用第一線的信息重新命名一千*.fna
文件在FASTA文件中,給出:
Buchnera_aphidicola_AE013218.1.fna
Borrelia_hermsii_CP000048.1.fna
FASTA頭保持不變。只是文件名。
什麼_exactly_進入文件名?前三個字按順序2,3,1沒有'>',用下劃線連接?還有別的嗎? –
正是@BenjaminW。單詞2,3,1以「_」(2_3_1)分隔,沒有「>」而沒有別的。 – Tetraodienne