我嘗試處理一些數據,但無法找到適用於我的問題的工作解決方案。我有一個文件,它看起來像:刪除含有30%以上小寫字母的行
>ram
cacacacacacacacacatatacacatacacatacacacacacacacacacacacacaca
cacacacacacacaca
>pam
GAATGTCAAAAAAAAAAAAAAAAActctctct
>sam
AATTGGCCAATTGGCAATTCCGGAATTCaattggccaattccggaattccaattccgg
and many lines more....
我想篩選出所有行和相應的標頭(標頭>開始),其中序列串(那些不開始>)被含有30%或更多小寫字母。序列字符串可以跨越多行。
所以命令後XY輸出應該是這樣的:
>pam
GAATGTCAAAAAAAAAAAAAAAAActctctct
我嘗試了while循環的一些混合讀取輸入文件,然後使用awk,grep的工作,sed的但沒有好結果。
您做出了嘗試和失敗?向我們展示你的努力。 – Inian
另外'bash'不適合這個,因爲它不能計算浮點數的值,也不能進行比較。你可以很好地刪除'bash'標籤 – Inian