fasta

    0熱度

    1回答

    我正在使用在fasta文件中搜索模式的python腳本。它工作得很好,但不會返回重疊的字符串。不幸的是,我對潛在的重疊字符串感興趣。由於我不是程序員(我只是想學習Python),我想知道是否有人可以修改腳本以找到重疊的字符串。我認爲正則表達式模塊可以做到這一點,但我試圖將它安裝在我的電腦(Windows)上,沒有成功。我得到了這個: C:\Python33>regex-2014.02.19>pyt

    1熱度

    2回答

    我有一個輸出文件,我想將它轉換爲I文件,我可以提取整個序列。 輸出是這樣的:(但當時沒有「在前面>並在每行之後有一個進入 ">comp2_c0_seq1 len=265 path=[1:0-264] GTTTGAATGGTTTGTGGTTCTGCCTTTGACAAACTGATCATAGTGGAATAATAAGGGAAC ATGAAGAAATTCCAAGCCCATTGATTTTCTCTTGAGA

    5熱度

    1回答

    我能夠下載一個FASTA文件中手動看起來像: >lcl|CR543861.1_gene_1... ATGCTTTGGACA... >lcl|CR543861.1_gene_2... GTGCGACTAAAA... 通過點擊「發送到」,然後選擇「基因功能」,FASTA核苷酸是唯一的選擇(這是很好的,因爲這就是我想要的)this page。 有了這樣的腳本: #!/usr/bin/env p

    2熱度

    3回答

    我在運行blastx上我的從頭轉錄組裝。雖然程序還在運行我已經獲得這樣的一個錯誤: Error: (1431.1) FASTA-Reader: Warning: FASTA-Reader: Title is very long: 1127 characters (max is 1000) ...等,其中的字符數有所不同。我在網上搜索這個特定的錯誤,但我似乎沒有找到任何有關它。我希望有人跑過去能

    0熱度

    2回答

    我想知道如果有人知道如何添加評論到fasta文件。我嘗試使用#字符,但與對齊算法/軟件不兼容。 謝謝,

    0熱度

    2回答

    我發現自己有一個獨特的問題。我需要解析一個文件,我需要把所有的行放入一個字符串中,我通常用str.strip()來處理,但是我意識到每行的開始和結尾都有空格,值。有沒有簡單的方法去除空格以外的所有空格?如果沒有,從我的字符串中刪除特定字符的好方法是什麼,因爲另一種方法是對出現的所有類型的空白執行此操作。 這裏是有問題的文件。 http://www.rcsb.org/pdb/files/ss.txt

    -3熱度

    3回答

    我正嘗試使用之前在此論壇上發佈的AWK腳本。我試圖將包含多個DNA序列的大型FASTA文件拆分爲單獨的FASTA文件。我需要將每個序列分離到它自己的FASTA文件中,並且每個新FASTA文件的名稱都需要是原始大型multifasta文件(>之後的所有字符)的DNA序列名稱。 我想這個劇本,我發現這裏的計算器: awk '/^>chr/ {OUT=substr($0,2) ".fa"}; OUT {

    1熱度

    2回答

    我需要最瑣碎的解決方案轉換fasta.txt包含多個核苷酸序列等 >seq1 TAGATTCTGAGTTATCTCTTGCATTAGCAGGTCATCCTGGTCAAACCGCTACTGTTCCGG CTTTCTGATAATTGATAGCATACGCTGCGAACCCACGGAAGGGGGTCGAGGACAGTGGTG >seq2 TCCCTCTAGAGGCTCTTTACCGTGATGCT

    0熱度

    1回答

    我在Biostars上發佈了這個同樣的窘境,但它似乎像交通低,所以我想我可能在這裏構成。 我試圖用Bioconductor的的「Biostrings」包和「DNAStringSet」功能導入序列的FASTA文件爲R,但我不斷收到同樣的錯誤: Error in .Call2("new_XString_from_CHARACTER", classname, x, start(solved_SEW),

    0熱度

    3回答

    我有一個FASTA文件格式像下面 >gi|84341511|gb|DU991381.1| KBrH087L18R KBrH (HindIII) BAC library Brassica rapa subsp. pekinensis Brassica rapa subsp. pekinensis genomic clone KBrH087L18, genomic survey sequence A