我需要解析初步GenBank平面文件。該序列尚未發佈,因此我無法通過加入來查找並下載FASTA文件。我是生物信息學的新手,所以有人可以告訴我在哪裏可以找到BioPerl或BioPython腳本來自己做這件事?謝謝!將GenBank平臺文件轉換爲FASTA
2
A
回答
0
您需要Bio::SeqIO模塊讀取或寫出生物信息學數據。 SeqIO HOWTO應該告訴你一切你需要知道的,但here's a small read-a-GenBank-file script in Perl讓你開始!
+1
謝謝,這適用於正常的genbank文件,但我的實際上是一個初步提交,所以我必須解析它自己。 – user81997 2011-06-14 13:24:35
1
我在這裏爲您提供Biopython解決方案。我會首先假設你的genbank文件涉及到一個基因組序列,然後我會提供一個不同的解決方案,假設它是一個基因序列。事實上,知道你正在處理哪些事情會有幫助。
基因組序列解析:在您的自定義GenBank中簡單文件
解析來自文件:
from Bio import SeqIO
record = SeqIO.read("yourGenbankFileDirectory/yourGenbankFile.gb","genbank")
如果你只是想那麼原始序列:
rawSequence = record.seq.tostring()
現在也許你需要爲此序列命名,在製作.fasta之前爲序列提供「>標題」。
nameSequence = record.features[0].qualifiers
這應返回與整個序列的各種同義詞詞典由基因庫文件的作者作爲註釋
基因序列解析:讓我們看看與GenBank中.gb文件來幹什麼名
解析從文件中通過自定義GenBank中簡單文件:
from Bio import SeqIO
record = SeqIO.read("yourGenbankFileDirectory/yourGenbankFile.gb","genbank")
要獲得的原料清單
rawSequenceList = [gene.extract(record.seq.tostring()) for gene in record.features]
以獲得每個基因序列名稱的列表(更準確地說是每個基因同義詞的詞典)
nameSequenceList = [gene.qualifiers for gene in record.features]
相關問題
- 1. 將GenBank格式文件轉換爲FASTA格式
- 2. 請幫助我從磁盤讀取genbank文件並將其轉換爲fasta
- 3. 如何查詢Genbank並將結果打印到fasta文件?
- 4. 如何將兩列的文本文件轉換爲fasta格式
- 5. 如何將PHYLIP格式轉換爲FASTA
- 6. 從tsv轉換爲fasta
- 7. 將MySQL轉換爲Sphinx搜索平臺
- 8. 將winsound轉換爲linux平臺?
- 9. 如何將python.py文件轉換爲可執行文件以使用跨平臺?
- 10. 解析GenBank文件
- 11. 將rtf文件轉換爲chm文件?將hlp文件轉換爲chm文件?
- 12. 如何將mysql平臺特定的查詢轉換爲非平臺特定的?
- 13. C#將任何字符串轉換爲安全的跨平臺文件名?
- 14. 如何在Android平臺上將聲音文件(.wav,.oog)轉換爲48KHZ輸出
- 15. 將文件轉換爲NTFS
- 16. 將IFile轉換爲文件
- 17. 將文件轉換爲流
- 18. 將流轉換爲文件
- 19. 將BufferedInputStream轉換爲文件
- 20. 將JarEntry轉換爲文件
- 21. 將文件轉換爲MultiPartFile
- 22. 將FileObject轉換爲文件
- 23. 將blob轉換爲文件
- 24. 將UploadedFile轉換爲文件
- 25. 將CommonsMultipartFile轉換爲文件
- 26. 將文件轉換爲BinaryTree
- 27. 將JasperPrint轉換爲文件
- 28. 將UTC tm *轉換爲本地化tm *的跨平臺方式?
- 29. 在Fedora平臺上將視頻轉換爲OGV
- 30. 如何在Azure平臺上使用PHP將.MPG轉換爲.FLV
谷歌搜索「biopython解析:所有基因的基因/列表,然後序列fasta「將這個http://www.biopython.org/wiki/SeqIO作爲第一場比賽。第二場比賽是解析fasta的教程。這是你想要的? – 2011-06-13 22:01:56
當然,使用「bioperl解析fasta」的搜索結果也會給出正確的結果,如常見問題解答:「我想解析FASTA或NCBI -m7(XML)格式,我該如何做?在http://www.bioperl.org/wiki/FAQ#I_want_to_parse_FASTA_or_NCBI_-m7_.28XML.29_format.2C_how_do_I_do_this.3F – mirod 2011-06-14 07:16:38