我有帶有核苷酸文本字符串的文件(A
,C
,G
,T
)。我想從文本文件中找到特定的字符串並刪除它們。從文本文件中刪除字符串
例如:
ACTGGGCTGTCCAACTG
ACTTCTGGGTCGAACTG
CCCACTTCTGGGTTCAA
而且我想從所有行只刪除該部分ACT
和GGG
然後我會得到這個字符串的文件:
CTGTCCAACTG
TCTTCGAACTG
CCCTCTTTCAA
我有帶有核苷酸文本字符串的文件(A
,C
,G
,T
)。我想從文本文件中找到特定的字符串並刪除它們。從文本文件中刪除字符串
例如:
ACTGGGCTGTCCAACTG
ACTTCTGGGTCGAACTG
CCCACTTCTGGGTTCAA
而且我想從所有行只刪除該部分ACT
和GGG
然後我會得到這個字符串的文件:
CTGTCCAACTG
TCTTCGAACTG
CCCTCTTTCAA
你可以試試:
awk '{gsub(/ACT|GGG/,"")}1' file
perl -pe 's/ACT|GGG//g' your_file
使用sed的
sed -r 's/(ACT|GGG)//g' file
可以把它從線條到下一個重疊? –