我是一名Python初學者(我是一名生物學家),我有一個包含特定軟件結果的文件,我想用python解析結果。從下面的輸出中,我想得到的只是分數,並希望將序列分成單獨的氨基酸。使用python解析結果
沒有。得分順序
1 0.273778 FFHH-YYFLHRRRKKCCNNN-CCCK---HQQ---HHKKHV-FGGGE-EDDEDEEEEEEEE-EE--
2 0.394647 IIVVIVVVVIVVVVVVVVVV-CCCVA-IVVI--LIIIIIIIIYYYA-AVVVVVVVAAAAV-AST-
3 0.456667 FIVVIVVVVIXXXXIGGGGT-CCCCAV -------------IVBBB-AAAAAA--------AAAA-
4 0.407581 MMLMILLLLMVVAIILLIII-LLLIVLLAVVVVVAAAVAAVAIIII-ILIIIIIILVIMKKMLA-
5 0.331761 AANSRQSNAAQRRQCSNNNR-RALERGGMFFRRKQNNQKQKKHHHY-FYFYYSNNWWFFFFFFR-
6 0.452381 EEEEDEEEEEEEEEEEEEEE-EEEEESSTSTTTAEEEEEEEEEEEE-EEEEEEEEEEEEEEEEE-
7 0.460385 LLLLLLLLMMIIILLLIIII-IIILLVILMMEEFLLLLILIVLLLM-LLLLLLLLLLVILLLVL-
8 0.438680 ILILLVVVVILVVVLQLLMM-QKQLIVVLLVIIMLLLLMLLSIIIS-SMMMILFFLLILIIVVL-
9 0.393291 QQQDEEEQAAEEEDEKGSSD-QQEQDDQDEEAAAHQLESSATVVQR-QQQQQVVYTHSTVTTTE-
從上面的表格,我想獲得相同數量,分數,但其單獨的序列表(縱列) 所以它應該看起來像
no. score amino acid(1st column)
1 0.273778 F
2 0.395657 I
3 0.456667 F
另一個表代表第二列氨基酸
no score amino acid (2nd column)
1 0.273778 F
2 0.395657 I
3 0.456667 I
第三個表代表氨基酸的第三列和第四個第四列的表氨基酸MN等
在此先感謝您的幫助
什麼的'F','I'和'F'立場?這些是上面字符串的第一個字符嗎?爲什麼'f'在第三行而不是'F'?我們不是Python的初學者,但我們也不是生物學家。我們可以用Python來幫助你,但你必須解釋這裏的個別氨基酸是什麼。 – eumiro
它應該爲F ...我已編輯了問題(F,I; F)。是氨基酸代碼,這是alignment.I願與得分分裂整個sequnece縱列的序列的結果和序列號。 – hari
你的描述如何去信件仍然不完全清楚。也許最好在序列中添加一些例子以及如何獲得理想的結果。 – hochl