fasta

    0熱度

    3回答

    我在我的文件夾中有一堆TSV文件,並且對於其中一個人我希望獲得一個fasta文件,其中標誌'>'後面的標頭是文件的名稱。 我的TSV文件具有5列,而不頭: 因此: inputfile中稱爲: 「A.coseq.table_headless.tsv」 HIV1B-pol-seed 15 MAX 1959 GTAACAGACTCACAATATGCATTAGGAATCATTCAAGC 輸出文件名爲 「A

    0熱度

    2回答

    我試圖製作的代碼是關於將含有來自DNA或mRNA的核苷酸(U,T,C,G或A)的FASTA文件翻譯成氨基酸。它運行得很好,但是當我運行我的程序時,它報告了一些我不明白的錯誤,即使我試圖修復它,但它不起作用。你們能給我一些提示嗎?我搜尋了一些可能的解決方案,但對我來說太難理解了。 我的代碼 #!/bin/usr/env python3 import sys codontable = {

    0熱度

    1回答

    我是一名具有0個計算機技能的生物學家,但我需要一個簡單的腳本將大量DNA序列劃分爲更小的.fasta進行BLAST搜索。我一直瀏覽這個網站幾天,找到一個無濟於事的答案。我幾乎從biopython食譜中複製了我的代碼。爲什麼這不起作用? def batch_iterator(iterator, batch_size): entry = True # Make sure we loop on

    1熱度

    2回答

    有人能幫助我想出一個策略編輯我的FASTA文件,該文件有下列格式 sp|Q9NYW0|T2R10_HUMAN Taste receptor type 2 member 10 OS=Homo sapiens sp|Q9NYV9|T2R13_HUMAN Taste receptor type 2 member 13 OS=Homo sapiens 條目對於這些線,我需要將文本「_REVERSED

    1熱度

    1回答

    我有10個fasta文件(每個文件包含來自10個樣本中的每個樣本的20個基因序列)。我想創建20個文件,針對10個樣本中的每個基因。我如下進行,以提取與所述FILE_NAME基因在標頭: pyfasta extract --header --fasta test.fasta gene_name1 | awk '/^>/ {$0=$0 "_file1"}1' > gene_name1.fasta

    0熱度

    4回答

    我有一個FASTA文件(testfile.fa),其中包含標題行(包含>開始處)以及帶有字符的行,表示某些類型的核苷酸A,C,G,T,a,g,c,t,N)。 >chr1 cccccccccttttttttaaaa AAAACCCCTTCCCCCCCCGGG GGGGGGGGGGGGGGGGGGGGG TTTTTTTTTTTTTTTTTTTTT >chr1_alt TCTCTCTCTCT

    0熱度

    1回答

    我有一個fasta文件。我需要刪除含有「N」或不含至少3個獨特鹼基的序列。 目前爲止的代碼如下。另外,我將如何刪除序列ID行,以便刪除序列。 #!/usr/bin/perl use strict; use warnings; open FILE, '<', $ARGV[0] or die qq{Failed to open "$ARGV[1]" for input: $!\n}; ope

    1熱度

    1回答

    我試圖用Biopython提取所有DNA序列從包含有以下的短DNA序列匹配一個FASTA文件:「GGCTCAACCCTGGA」 以下是我迄今爲止: from Bio import SeqIO source = "rep_set_no_spaces.fasta" outfile = "rep_set_PNA_matches.fasta" seq1 = "GGCTCAACCCTGGA" #

    -1熱度

    2回答

    我有基因序列文件,我想更改每個基因的標題。這裏是輸入: >lcl|CP000046.1_cds_AAW37389.1_1 [gene=dnaA] [locus_tag=SACOL0001] [protein=chromosomal replication initiator protein DnaA] [protein_id=AAW37389.1] [location=544..1905] [gb

    0熱度

    2回答

    我有兩個文件: ID.txt含蛋白質的ID,像這樣: KKP65897.1 KKP42119.1 KKP91065.1 OGY93232.1 另一個文件是nr.faa。它是從NCBI下載的數據庫fasta格式文件。它是這樣的: >KKP42119.1 hypothetical protein DDB_G027....... MASTQNTVEEVAQJML....... >KKP65