dna-sequence

    0熱度

    2回答

    我真的很難學習Python 3,現在我正在爲這一個練習而努力。 我必須寫一個函數,使用兩個參數: 1)它是一種DNA序列的字符串。 2)相同的長度作爲參數酮(也DNA序列) 函數必須返回一個浮子(那是在兩個DNA序列相同的鹼基比例的字符串)。 所以,我知道我必須寫,這將返回類似這樣的功能: seq_similarity("ATGC","AGTT") 應該返回 0.75 我只走到這一步,現在

    0熱度

    1回答

    我有一個數據集包含DNA序列,我想將它們轉換成數字表示。本文件中: 這是什麼過程(轉變),我想搜索一下嗎? 如何在python中應用它? 它可以作爲一個大數組,作爲數據集輸入嗎?

    2熱度

    1回答

    這是我必須實現我的目標,如標題中所述的代碼。我現在似乎遇到的問題是第二行代碼。我添加它的那一刻,程序停止工作,沒有給我一個錯誤。先謝謝您的幫助。 seqDNA = input() seqDNA = seqDNA.upper() comp = '' for c in seqDNA: if c == 'a': comp = comp + 'u' elif c ==

    0熱度

    1回答

    如何循環通過配對結束fastq文件?對於單端讀取,你可以做以下 library(ShortRead) strm <- FastqStreamer("./my.fastq.gz") repeat { fq <- yield(strm) if (length(fq) == 0) break #do things writeFasta(fq,

    0熱度

    1回答

    counter=0 i=0 dna_string = "CGATATATCCATAG" if dna_string[i:i+len("ATA")]=="ATA": counter=counter+1 print (counter) 0 我試圖數數。在dna_string中出現的「ATA」這應該給出3的答案,但它給出了0!

    3熱度

    1回答

    所以我給出了對齊2個DNA序列中最低成本的任務。一個失敗的輸入是 CGCAATTCTGAAGCGCTGGGGAAGACGGGT & TATCCCATCGAACGCCTATTCTAGGAT 在正確對準成本24,但我得到的23 成本,我要讀的切換成本基礎說,一個A - > T,G - > C等等我給出的成本文件是 *,-,A,T,G,C -,0,1,2,1,3 A,1,0,1,5,1 T,2

    0熱度

    1回答

    我試圖實現遺傳算法將DNA片段組裝成一個只給出光譜序列。我唯一的運營商是Edge Recombination,我確信它足以獲得相當不錯的結果。 但是......我無法擊敗80%(最佳分數的百分比),並且有500個碎片的實例可能需要2小時(如果在100次迭代中沒有改善,算法會停止)。我甚至執行它的權利?我沒有發現任何交叉運營商應該選擇匹配更好的元素(片段重疊 - 在大多數論文中,它只是我們挑選的),

    0熱度

    1回答

    我需要使用混亂的遊戲表現,我從波斯蒂安Cigan的博客(https://bostjan-cigan.com/chaos-game-representation-of-gene-structure-in-python/) 作者這個Python代碼代表許多基因序列:波斯蒂安Cigan https://bostjan-cigan.com import collections from coll

    1熱度

    2回答

    我想用matplotlib繪製sequence logos。 整個代碼可以在gist 有關部分是: class Scale(matplotlib.patheffects.RendererBase): def __init__(self, sx, sy=None): self._sx = sx self._sy = sy def draw_path(se

    0熱度

    1回答

    假設有一個函數。該函數將字符串作爲參數。 該函數是一個類的函數之一。收到一個字符串後,它會根據子字符串計算一些變量。 在該過程的一部分中,我需要將鍵值對附加到字典中。 這些值應該從所提到的字符串的幾個部分計算,但每個char需要(在轉換爲int之後)被提升爲2的特定冪。權力從0增加到子串結尾。 我怕我不知道如何解決提高電源的兩個incementation部分: self.topologia = {