fasta

    1熱度

    1回答

    我有以下問題:我有10個不同的FASTA文件,每個文件中有一千個序列。我想從每個fasta文件讀取所有序列,然後(用粘貼)創建一個包含所有序列的大文件。 我的問題如下:如何在同一時間從不同的文件讀取? 我想: a<-list.files() 然後 for (x in a) { temp<-read.table(x) seq<-summary(temp) print (seq) ,但它不能正

    2熱度

    2回答

    我正在考慮解析一個平行於的fasta文件的方法。對於那些不知道的fasta格式的示例: >SEQUENCE_1 MTEITAAMVKELRESTGAGMMDCKNALSETNGDFDKAVQLLREKGLGKAAKKADRLAAEG LVSVKVSDDFTIAAMRPSYLSYEDLDMTFVENEYKALVAELEKENEERRRLKDPNKPEHK IPQFASRKQLSDAILKEAE

    2熱度

    3回答

    我試圖組織多個序列的文件。爲此,我試圖將名稱添加到列表中,並將序列添加到與名稱列表並行的單獨列表中。我想出瞭如何將名稱添加到列表中,但我無法弄清楚如何將隨後的序列添加到單獨的列表中。我嘗試將序列行附加到空字符串中,但它將所有序列的所有行附加到單個字符串中。 所有的名字開始與「>」 def Name_Organizer(FASTA,output): import os impo

    1熱度

    1回答

    我要開始的通過顯示的代碼我迄今: def err(em): print(em) exit def rF(f): s = "" try: fh = open(f, 'r') except IOError: e = "Could not open the file: " + f err(e) try:

    7熱度

    2回答

    我想了解FASTA算法在數據庫中搜索查詢序列的相似序列的基本步驟。這些都是該算法的步驟: 確定共同的k字I和J之間的k個字 分數對角線相匹配時,識別10個最好 對角線 Rescore初始區域具有取代得分矩陣 加入初始區域使用的空白,爲懲罰差距 執行動態編程來找到最終的路線 我對使用PAM250評分矩陣的第三和第四步以及如何「使用差距加入」感到困惑。 有人可以爲我解釋這兩個步驟「儘可能具體」。 感謝

    5熱度

    3回答

    我正在寫一些代碼,需要閱讀fasta files,所以我的部分代碼(下面包括)是一個fasta分析器。由於單個序列可以跨越fasta格式的多行,因此我需要將從文件讀取的多個連續行連接成單個字符串。我這樣做,通過在讀取每行後重新分配字符串緩衝區,成爲序列的當前長度加上讀入的行的長度。我還做了一些其他的東西,比如剝離空白區等等。第一個序列,但fasta文件可以包含多個序列。同樣,我有一個動態數組結構,

    3熱度

    2回答

    我有大量條目的FASTA文件。雖然所有的DNA序列都不同,但一些FASTA名稱是相同的。如果有多個名稱的副本,我想附加一個數字,以使它們成爲唯一的名稱。例如: >NAME ATTTTTGGGGGGTGTGTG >NAME ATTTTTTTTCGCGCGC >NAME AAACCCTTTGTG 將成爲: >NAME_1 ATTTTTGGGGGGTGTGTG >NAME_2 ATT

    2熱度

    1回答

    在繼續之前,我想我會引用讀者對Perl以前的問題,作爲所有這些的初學者。 這些都是我的職位,在過去的幾天裏,按時間順序: How do I average column values from a tab-separated data...(解決) Why do I see no computed results in my output file?(解決) Using a .fasta file

    1熱度

    2回答

    到目前爲止,我設法獲得了對Perl的更多理解,這是一種解脫,我擁有你大家要謝謝。我目前仍在研究另一個需要閱讀.fasta文件並查找所有G和C核苷酸然後創建制表符分隔的文件的方面。 這些都是我的職位,在過去的幾天裏,按時間順序: How do I average column values from a tab-separated data...(解決) Why do I see no comput

    7熱度

    1回答

    我曾嘗試數學代碼用於使混亂遊戲張貼在這個地址的DNA序列: http://facstaff.unca.edu/mcmcclur/blog/GeneCGR.html 其是這樣的: genome = Import["c:\data\sequence.fasta", "Sequence"]; genome = StringReplace[ToString[genome], {"{" -> "", "}