fasta

1熱度

1回答

我有以下問題：我有10個不同的FASTA文件，每個文件中有一千個序列。我想從每個fasta文件讀取所有序列，然後（用粘貼）創建一個包含所有序列的大文件。我的問題如下：如何在同一時間從不同的文件讀取？我想： a<-list.files() 然後 for (x in a) { temp<-read.table(x) seq<-summary(temp) print (seq) ，但它不能正

2熱度

2回答

並行解析文件

我正在考慮解析一個平行於的fasta文件的方法。對於那些不知道的fasta格式的示例： >SEQUENCE_1 MTEITAAMVKELRESTGAGMMDCKNALSETNGDFDKAVQLLREKGLGKAAKKADRLAAEG LVSVKVSDDFTIAAMRPSYLSYEDLDMTFVENEYKALVAELEKENEERRRLKDPNKPEHK IPQFASRKQLSDAILKEAE

2熱度

3回答

從FASTA文件添加多個序列到Python中的列表

我試圖組織多個序列的文件。爲此，我試圖將名稱添加到列表中，並將序列添加到與名稱列表並行的單獨列表中。我想出瞭如何將名稱添加到列表中，但我無法弄清楚如何將隨後的序列添加到單獨的列表中。我嘗試將序列行附加到空字符串中，但它將所有序列的所有行附加到單個字符串中。所有的名字開始與「>」 def Name_Organizer(FASTA,output): import os impo

1熱度

1回答

Python命令行凍結閱讀（FASTA）文件

我要開始的通過顯示的代碼我迄今： def err(em): print(em) exit def rF(f): s = "" try: fh = open(f, 'r') except IOError: e = "Could not open the file: " + f err(e) try:

7熱度

2回答

FASTA算法解釋

我想了解FASTA算法在數據庫中搜索查詢序列的相似序列的基本步驟。這些都是該算法的步驟：確定共同的k字I和J之間的k個字分數對角線相匹配時，識別10個最好對角線 Rescore初始區域具有取代得分矩陣加入初始區域使用的空白，爲懲罰差距執行動態編程來找到最終的路線我對使用PAM250評分矩陣的第三和第四步以及如何「使用差距加入」感到困惑。有人可以爲我解釋這兩個步驟「儘可能具體」。感謝

5熱度

3回答

使用realloc擴展緩衝區，同時從文件崩潰讀取

我正在寫一些代碼，需要閱讀fasta files，所以我的部分代碼（下面包括）是一個fasta分析器。由於單個序列可以跨越fasta格式的多行，因此我需要將從文件讀取的多個連續行連接成單個字符串。我這樣做，通過在讀取每行後重新分配字符串緩衝區，成爲序列的當前長度加上讀入的行的長度。我還做了一些其他的東西，比如剝離空白區等等。第一個序列，但fasta文件可以包含多個序列。同樣，我有一個動態數組結構，

3熱度

2回答

遍歷FASTA條目，並重新命名重複

我有大量條目的FASTA文件。雖然所有的DNA序列都不同，但一些FASTA名稱是相同的。如果有多個名稱的副本，我想附加一個數字，以使它們成爲唯一的名稱。例如： >NAME ATTTTTGGGGGGTGTGTG >NAME ATTTTTTTTCGCGCGC >NAME AAACCCTTTGTG 將成爲： >NAME_1 ATTTTTGGGGGGTGTGTG >NAME_2 ATT

2熱度

1回答

讀取.fasta序列以提取核苷酸數據，然後寫入TabDelimited文件

在繼續之前，我想我會引用讀者對Perl以前的問題，作爲所有這些的初學者。這些都是我的職位，在過去的幾天裏，按時間順序： How do I average column values from a tab-separated data...（解決） Why do I see no computed results in my output file?（解決） Using a .fasta file

1熱度

2回答

Perl程序打印完整的.fasta文件序列，但試圖實現關於基因的特定核苷酸計數

到目前爲止，我設法獲得了對Perl的更多理解，這是一種解脫，我擁有你大家要謝謝。我目前仍在研究另一個需要閱讀.fasta文件並查找所有G和C核苷酸然後創建制表符分隔的文件的方面。這些都是我的職位，在過去的幾天裏，按時間順序： How do I average column values from a tab-separated data...（解決） Why do I see no comput

7熱度

1回答

混亂遊戲DNA序列

我曾嘗試數學代碼用於使混亂遊戲張貼在這個地址的DNA序列： http://facstaff.unca.edu/mcmcclur/blog/GeneCGR.html 其是這樣的： genome = Import["c:\data\sequence.fasta", "Sequence"]; genome = StringReplace[ToString[genome], {"{" -> "", "}