fasta

1熱度

5回答

我是perl的新手。仍在學習。我有一個fasta格式的文件。我想提取跨越特定位置的序列。例如，從位置200至300 >Contig[0001] TGCATCAAAAGCTGAAAATATGTAGTCGAGAAGTCATTTCGAGAAATTGACGTTTTAAGT TTCGGTTTCCAAATTCAACCGGATGTATCTTCGCCAATAATTGTCAGCAGTTAGAATTTC TT

0熱度

5回答

將公式應用到數據行，它跨越多行

我剛剛開始嘗試學習一些Python的第一步。目前正在通過旨在教授生物信息學python技能的Rosalind在線課程。（非常好，請參閱：rosalind.info）我正在努力解決一個特定的問題。我在FASTA格式的文件，其具有形式，因此： >Sequence_Header_1 ACGTACGTACGTACGTACGT ACGTACGTACGTACGTACGT >Sequence_Head

0熱度

1回答

如何縮短基因組序列以確保我的工作流程正常工作？

我是德國海德堡大學的莫里茨。對於我的學士論文，我有20個大的（25-30 GB）的基因組文件（.txt.gz）由肝細胞癌患者。我的Ubuntu服務器上安裝了Bpipe，我必須嘗試幾種方法。包括步驟是：對齊（BWA（變換賽和SAM））抗hg19.fasta 變換（samtols）重複數據刪除我的問題是爲了嘗試我的bpipe工作流程，我必須採取30 GB的整個序列，並從頭開始。這需要很多時間

3熱度

4回答

提取行和子上的另一個文件的信息

我有一個文件1.blast與協調這樣 1 gnl|BL_ORD_ID|0 100.00 33 0 0 1 3 27620 gnl|BL_ORD_ID|0 95.65 46 2 0 1 46 35296 gnl|BL_ORD_ID|0 90.91 44 4 0 3 46 35973 gnl|BL_ORD_ID|0 100.00 45 0 0 1 45 412

0熱度

1回答

拆分序列

我用FASTA文件格式，我想從中提取就是序列不IDS，並分割序列，我寫這篇文章的代碼 outfile=open('output.txt','r') for line in open('sequences.fasta') if line[0]==">": continue outfile.write(line) 這一步創建一個文本文件巫包含序列，

1熱度

1回答

如何對文件中的多個字符串執行若干修改並輸出到新文件

我是python編程的新手，並且有一個fasta文件，我想解析它以便在特定軟件中使用。該文件包含兩行：1）在分類學的序列標識符和用空格隔開的分類法，和最後種名也可以包含空格，和2）的DNA序列（參見下面的實施例）： >123876987 Bacteria;test;test;test test test ATCTGCTGCATGCATGCATCGACTGCATGAC >239847239 Ba

0熱度

2回答

如何分割的fasta文件

該代碼可用於從FASTA文件提取和分離序列 outfile=open('outf','w') for line in open('input'): if line[0]==">": outfile.write('\n') else: outfile.write(line.strip()) outfile.close() all_codon

0熱度

1回答

從FASTA頭文件中提取條款

我需要爲以下術語解析FASTA頭文件：葉，芽，莖和嫩芽，如果序列包含任何一個術語，則打開一個文件並將其放在那裏使用Biopython。所以我讓他們轉換爲使用SeqIO.to_dict字典： from Bio import SeqIO records_dict = SeqIO.to_dict(SeqIO.parse("my_example.fasta","fasta")) 但現在我不知道如何

0熱度

1回答

Python：在fasta頭文件中添加增量ID

我嘗試使用頭文件中的增量ID從.csv文件創建多個fasta。但是我的腳本運行不正常。任何建議？ M=open('/home/anna/Scrivania/db_mat/matk_2db_c.csv','r') M_out=open('/home/anna/Scrivania/db_mat/db_matk_bronx.fas', 'w') for i in range[1,92]:

2熱度

4回答

從FASTA文件輸入從FASTA文件獲取特定的序列與正則表達式

我想檢索第n 個序列（或優選爲正第至m 第序列），可與UNIX「一個理想的-襯墊」。我知道我可以用perl（或任何其他腳本語言）讀取序列，計數，然後打印序列，但我正在尋找更快，更緊湊的東西。對於那些不知道，一個樣本FASTA文件如下所示： >SEQUENCE_1 MTEITAAMVKELRESTGAGMMDCKNALSETNGDFDKAVQLLREKGLGKAAKKADRLAAEG LVS