1
如果我使用下面鏈接中的FASTA文件,我應該在Biopython中使用哪種字母類型?會不會是IUPAC.unambiguous_dna?我應該在Biopython中使用哪種字母表類型與FASTA文件?
鏈接FASTA文件:http://hgdownload.cse.ucsc.edu/goldenPath/hg19/chromosomes/?C=S;O=A
如果我使用下面鏈接中的FASTA文件,我應該在Biopython中使用哪種字母類型?會不會是IUPAC.unambiguous_dna?我應該在Biopython中使用哪種字母表類型與FASTA文件?
鏈接FASTA文件:http://hgdownload.cse.ucsc.edu/goldenPath/hg19/chromosomes/?C=S;O=A
你看過3.1 Sequences and Alphabets?它解釋了可用的不同字母,以及它們覆蓋的情況。
您提供的鏈接中有很多序列(對於我們來說太多了,無法完成)。我的建議是去UnambiguousDNA
。如果四個基本核苷酸不夠,解析器將會發出抱怨,並且您應該選擇更廣泛的字母表。
我會建議詢問biostars.org,更有可能在那裏找到更好的答案 – Stedy 2013-03-18 01:08:13