我正在嘗試Biopython
模塊的方法。在短序列上使用它很簡單,直接給出一個對齊矩陣。不過,我真的需要在更大的序列上運行它(平均長度爲2000 nucleatides (or) characters
)。但是我一直在遇到Out of Memory
錯誤。我看了一下,發現this上一個問題。Biopython全局對齊:內存不足
- 我試圖用一個
64-bit
蟒蛇,因爲我的個人電腦有4gb
RAM:因爲它們鏈接到this相同的網站,不能訪問now.Apart從此我嘗試了這些步驟中提供的答案是不是有幫助。 ssh
編輯了一個16gb
內存的小學校服務器,並試圖運行。它在接近4小時後仍然運行。
由於它是一個小腳本,我不確定如何修改它。任何幫助將不勝感激。
我的腳本:
import os
from Bio import pairwise2
from Bio.pairwise2 import format_alignment
file_list = []
file_list = [each for each in os.listdir(os.getcwd()) if each.endswith(".dna")]
align_file = open("seq_align.aln","w")
seq_list = []
for each_file in file_list:
f_o = open(each_file,"r")
seq_list.append(f_o.read())
for a in pairwise2.align.globalmx(seq_list[0],seq_list[1]):
align_file.write(format_alignment(*a))
align_file.close()
你有多少'.dna'文件? – 2014-10-12 04:42:04
有100個文件夾,每個文件夾有1-10個'.dna'文件。我現在只有1個文件夾,現在有2個文件 – Beginner 2014-10-12 05:15:39
每個文件有多行,或只有一個很長的行? – 2014-10-12 05:16:44