2017-09-28 67 views
0

我對python一無所知,而且我試圖將來自各個線程的信息拼湊起來以完成一項任務,但我仍然無法破解它。使用Python找到mRNA序列中的ATG

下面是分配:

說明 一個)下載的序列爲RAI1 mRNA NM_030665,和使用Python計數ATG子序列的數量,使用:

countATG = seq.count('ATG'). 

例如,對於SREBF1 NM_001005291.2,所述答案是45

我不是在尋找問題的答案。我真的很想了解更多關於Python的知識,如果有人能告訴我如何去完成這個問題,我會非常感激。我將序列保存到我的桌面上作爲.txt文件,但我不知道如何指定seq1應等於數據文件(如果有意義的話)。是的,我可以按Ctrl + F在NCBI上的順序,但我想學習如何使用python。

謝謝!

+0

你提到的計數方法,如果沒有空間插圖中的字母應該工作,他們都是大寫。爲了閱讀文件,請看[文件對象的Python方法](https://docs.python.org/2/tutorial/inputoutput.html#methods-of-file-objects) – Igle

回答

0

在這裏你去:

filepath = '/path/to/file.txt' 

with open(filepath) as infile: 
    seq = infile.readlines() 

# This will bring in the sequence, but if its split up on multiple lines 
# (like if its cut off at every 50 bp), then you'll want to piece it back 
# together, so you don't miss any ATG's. 

seq = ''.join([line.strip() for line in seq.split()]) 

ATG_count = seq.count('ATG') 

print(ATG_count)