fasta

    1熱度

    5回答

    我是perl的新手。仍在學習。 我有一個fasta格式的文件。我想提取跨越特定位置的序列。例如,從位置200至300 >Contig[0001] TGCATCAAAAGCTGAAAATATGTAGTCGAGAAGTCATTTCGAGAAATTGACGTTTTAAGT TTCGGTTTCCAAATTCAACCGGATGTATCTTCGCCAATAATTGTCAGCAGTTAGAATTTC TT

    0熱度

    5回答

    我剛剛開始嘗試學習一些Python的第一步。目前正在通過旨在教授生物信息學python技能的Rosalind在線課程。 (非常好,請參閱:rosalind.info) 我正在努力解決一個特定的問題。我在FASTA格式的文件,其具有形式,因此: >Sequence_Header_1 ACGTACGTACGTACGTACGT ACGTACGTACGTACGTACGT >Sequence_Head

    0熱度

    1回答

    我是德國海德堡大學的莫里茨。 對於我的學士論文,我有20個大的(25-30 GB)的基因組文件(.txt.gz)由肝細胞癌患者。我的Ubuntu服務器上安裝了Bpipe,我必須嘗試幾種方法。包括 步驟是: 對齊(BWA(變換賽和SAM))抗hg19.fasta 變換(samtols) 重複數據刪除 我的問題是爲了嘗試我的bpipe工作流程,我必須採取30 GB的整個序列,並從頭開始。這需要很多時間

    3熱度

    4回答

    我有一個文件1.blast與協調這樣 1 gnl|BL_ORD_ID|0 100.00 33 0 0 1 3 27620 gnl|BL_ORD_ID|0 95.65 46 2 0 1 46 35296 gnl|BL_ORD_ID|0 90.91 44 4 0 3 46 35973 gnl|BL_ORD_ID|0 100.00 45 0 0 1 45 412

    0熱度

    1回答

    我用FASTA文件格式,我想從中提取就是序列不IDS,並分割序列,我寫這篇文章的代碼 outfile=open('output.txt','r') for line in open('sequences.fasta') if line[0]==">": continue outfile.write(line) 這一步創建一個文本文件巫包含序列,

    1熱度

    1回答

    我是python編程的新手,並且有一個fasta文件,我想解析它以便在特定軟件中使用。該文件包含兩行:1)在分類學的序列標識符和用空格隔開的分類法,和最後種名也可以包含空格,和2)的DNA序列(參見下面的實施例): >123876987 Bacteria;test;test;test test test ATCTGCTGCATGCATGCATCGACTGCATGAC >239847239 Ba

    0熱度

    2回答

    該代碼可用於從FASTA文件提取和分離序列 outfile=open('outf','w') for line in open('input'): if line[0]==">": outfile.write('\n') else: outfile.write(line.strip()) outfile.close() all_codon

    0熱度

    1回答

    我需要爲以下術語解析FASTA頭文件:葉,芽,莖和嫩芽,如果序列包含任何一個術語,則打開一個文件並將其放在那裏使用Biopython。 所以我讓他們轉換爲使用SeqIO.to_dict字典: from Bio import SeqIO records_dict = SeqIO.to_dict(SeqIO.parse("my_example.fasta","fasta")) 但現在我不知道如何

    0熱度

    1回答

    我嘗試使用頭文件中的增量ID從.csv文件創建多個fasta。但是我的腳本運行不正常。任何建議? M=open('/home/anna/Scrivania/db_mat/matk_2db_c.csv','r') M_out=open('/home/anna/Scrivania/db_mat/db_matk_bronx.fas', 'w') for i in range[1,92]:

    2熱度

    4回答

    我想檢索第n 個序列(或優選爲正第至m 第序列),可與UNIX「一個理想的-襯墊」。 我知道我可以用perl(或任何其他腳本語言)讀取序列,計數,然後打印序列,但我正在尋找更快,更緊湊的東西。 對於那些不知道,一個樣本FASTA文件如下所示: >SEQUENCE_1 MTEITAAMVKELRESTGAGMMDCKNALSETNGDFDKAVQLLREKGLGKAAKKADRLAAEG LVS