fasta

0熱度

1回答

我正在使用在fasta文件中搜索模式的python腳本。它工作得很好，但不會返回重疊的字符串。不幸的是，我對潛在的重疊字符串感興趣。由於我不是程序員（我只是想學習Python），我想知道是否有人可以修改腳本以找到重疊的字符串。我認爲正則表達式模塊可以做到這一點，但我試圖將它安裝在我的電腦（Windows）上，沒有成功。我得到了這個： C:\Python33>regex-2014.02.19>pyt

1熱度

2回答

用linux替換序列文件中的空格fasta

我有一個輸出文件，我想將它轉換爲I文件，我可以提取整個序列。輸出是這樣的：（但當時沒有「在前面>並在每行之後有一個進入 ">comp2_c0_seq1 len=265 path=[1:0-264] GTTTGAATGGTTTGTGGTTCTGCCTTTGACAAACTGATCATAGTGGAATAATAAGGGAAC ATGAAGAAATTCCAAGCCCATTGATTTTCTCTTGAGA

5熱度

1回答

如何使用Perl從NCBI獲得FASTA核苷酸格式的基因特徵？

我能夠下載一個FASTA文件中手動看起來像： >lcl|CR543861.1_gene_1... ATGCTTTGGACA... >lcl|CR543861.1_gene_2... GTGCGACTAAAA... 通過點擊「發送到」，然後選擇「基因功能」，FASTA核苷酸是唯一的選擇（這是很好的，因爲這就是我想要的）this page。有了這樣的腳本： #!/usr/bin/env p

2熱度

3回答

錯誤：（1431.1）FASTA-Reader：警告：FASTA-Reader：標題非常長：1127個字符（最大爲1000）

我在運行blastx上我的從頭轉錄組裝。雖然程序還在運行我已經獲得這樣的一個錯誤： Error: (1431.1) FASTA-Reader: Warning: FASTA-Reader: Title is very long: 1127 characters (max is 1000) ...等，其中的字符數有所不同。我在網上搜索這個特定的錯誤，但我似乎沒有找到任何有關它。我希望有人跑過去能

0熱度

2回答

你可以在fasta文件中插入非序列相關的註釋嗎？

我想知道如果有人知道如何添加評論到fasta文件。我嘗試使用＃字符，但與對齊算法/軟件不兼容。謝謝，

0熱度

2回答

帶空白除空格

我發現自己有一個獨特的問題。我需要解析一個文件，我需要把所有的行放入一個字符串中，我通常用str.strip（）來處理，但是我意識到每行的開始和結尾都有空格，值。有沒有簡單的方法去除空格以外的所有空格？如果沒有，從我的字符串中刪除特定字符的好方法是什麼，因爲另一種方法是對出現的所有類型的空白執行此操作。這裏是有問題的文件。 http://www.rcsb.org/pdb/files/ss.txt

-3熱度

3回答

將多個FASTA文件拆分爲保留其原始名稱的單獨文件

我正嘗試使用之前在此論壇上發佈的AWK腳本。我試圖將包含多個DNA序列的大型FASTA文件拆分爲單獨的FASTA文件。我需要將每個序列分離到它自己的FASTA文件中，並且每個新FASTA文件的名稱都需要是原始大型multifasta文件（>之後的所有字符）的DNA序列名稱。我想這個劇本，我發現這裏的計算器： awk '/^>chr/ {OUT=substr($0,2) ".fa"}; OUT {

1熱度

2回答

解析FASTA序列到詞典

我需要最瑣碎的解決方案轉換fasta.txt包含多個核苷酸序列等 >seq1 TAGATTCTGAGTTATCTCTTGCATTAGCAGGTCATCCTGGTCAAACCGCTACTGTTCCGG CTTTCTGATAATTGATAGCATACGCTGCGAACCCACGGAAGGGGGTCGAGGACAGTGGTG >seq2 TCCCTCTAGAGGCTCTTTACCGTGATGCT

0熱度

1回答

DNAStringSet錯誤Biostrings在R

我在Biostars上發佈了這個同樣的窘境，但它似乎像交通低，所以我想我可能在這裏構成。我試圖用Bioconductor的的「Biostrings」包和「DNAStringSet」功能導入序列的FASTA文件爲R，但我不斷收到同樣的錯誤： Error in .Call2("new_XString_from_CHARACTER", classname, x, start(solved_SEW),

0熱度

3回答

perl的基本FASTA頭和序列分離

我有一個FASTA文件格式像下面 >gi|84341511|gb|DU991381.1| KBrH087L18R KBrH (HindIII) BAC library Brassica rapa subsp. pekinensis Brassica rapa subsp. pekinensis genomic clone KBrH087L18, genomic survey sequence A