我在文件中有以下行。這裏是一個行的一個示例:快速基本循環
NM _ ???? chr12 - 10 110 10 110 3 10,50,100,20,60,110,
我有以下代碼來獲取信息了:
fp = open(infile, 'r')
for line in fp:
tokens = line.split()
exonstarts = tokens[8][:-1].split(',')
exonends = tokens[9][:-1].split(',')
這會給我這樣的一個列表:
exonstarts = [10,50,100]
exonends = [20,60,110]
這有3個外顯子(儘管在該文件的其他線可具有超過3個或更少,因此必須爲任何數量的外顯子的工作),他們從去:
10-20
50-60
100-110
因此,對於開始列表中的每個數字,在完成列表中都有一個數字。 這意味着第一個密碼子在exonstarts [0]開始,在 exonends [0]結束。第二個在exonstarts [1]開始,在exonends [1]結束。 依此類推。
我怎樣寫這段代碼的其餘部分,以便它把元素配對這樣?
更新:
從這:
tokens = line.split()
exonstarts = tokens[8][:-1].split(',')
exonends = tokens[9][:-1].split(',')
zipped = list(zip(exonstarts, exonends))
我還有一個問題,我有,我想這些作品的刺痛。因此,例如,我想chr_string[10:20]+chr_string[50:60]+chr_string[100:110]
有沒有一種方法,我可以輕鬆地說這個?
對不起,小白編程的問題。我真的很需要的時間緊迫,我發現自己在 – 2012-04-28 00:02:02
不需要道歉帕特里克一些幫助,這就是網站是這裏:) – 2012-04-28 00:05:54
@PatrickCampbell:一般情況下,它的首選,你打開一個新的問題,對於這樣的followups 。 – 2012-04-28 00:36:33