我有一個XML格式的BLAST輸出文件。它是從每個序列中報告的具有50個命中的22個查詢序列。我想提取所有50x22的點擊。這是我目前擁有的代碼,但它僅從第一個查詢中提取50個匹配。BioPython:從Blast輸出文件中提取序列ID
from Bio.Blast import NCBIXM
blast_records = NCBIXML.parse(result_handle)
blast_record = blast_records.next()
save_file = open("/Users/jonbra/Desktop/my_fasta_seq.fasta", 'w')
for alignment in blast_record.alignments:
for hsp in alignment.hsps:
save_file.write('>%s\n' % (alignment.title,))
save_file.close()
有人有任何建議,以提取所有的命中?我想我必須使用別的比對齊。 希望這很清楚。謝謝!
Jon
爲什麼雙重帖子? http://stackoverflow.com/questions/1684194/python-saving-output-of-a-for-loop-to-file一個小時前左右? – mjv 2009-11-05 23:57:56
由於這裏的大多數人可能不使用BioPython,如果你提供了一些有用的鏈接,你可能會得到更多的答案 – 2009-11-05 23:59:12
mjv:以前的文章是關於如何保存輸出。這幾乎是相同的代碼,但現在我想改變它。 gnibbler:你是指什麼有用的鏈接?像鏈接幫助解答?我一直在檢查很多鏈接。像biopython文檔一樣,但問題是我很難閱讀這些文檔 – Jon 2009-11-06 00:34:08