bioinformatics

    1熱度

    1回答

    我想搜索並計算在較大序列(F)內發生的小DNA序列(R)的數量,但R有幾個可能是變量。我認爲最簡單的方法是設置R的比率並在F中將所有命中數計數在80%以上,但似乎只執行此操作的命令(例如difflib的SequenceMatcher或get_close_matches)需要使用列表才能工作。我不能把F分成任何這樣的名單。有任何想法嗎? 編輯2:更多信息請求。 DNA片段(F)中存在一定數量的重複序

    1熱度

    2回答

    我有這樣(來自DNA測序)數據: read.lengths = c(100, 100, 200, 250, 300, 400, 400, 500, 500) 每個長度僅僅是一個數字的在讀取DNA鹼基。給定任意數量的分箱,繪製讀取長度與計數的直方圖非常簡單。 ggplot(data.frame(read.lengths)) + geom_histogram(aes(x = read.length

    0熱度

    2回答

    我目前正在編寫「正在做」的程序,並繪製DNA樣本的相位分析,並且出現了一些問題:Output plot HERE!右側的圖像來自MATLAB並且是它應該如何看起來的例子。左邊的圖像是從我的程序輸出的。正如你所看到的藍色圖形看起來是正確的,但它是在不同的角度。我檢查過代碼,它和我的程序的MATLAB版本基本相同。無論如何,我會把它放在這裏,也許有一個我不知道的錯誤。但如果不是這樣,是否有一種「轉向/

    1熱度

    3回答

    請幫我解析一個VCF文件。我正在粘貼一個真實的例子。 輸入: 1 1014143 rs786201005 C T . . RS=786201005;RSPOS=1014143;dbSNPBuildID=144;SSR=0;SAO=1;VP=0x050068000605000002110100;GENEINFO=ISG15:9636;WGT=1;VC=SNV;PM;PMC;NSN;REF;ASP;L

    0熱度

    1回答

    我有一個數據集包含DNA序列,我想將它們轉換成數字表示。本文件中: 這是什麼過程(轉變),我想搜索一下嗎? 如何在python中應用它? 它可以作爲一個大數組,作爲數據集輸入嗎?

    -1熱度

    1回答

    我想分配兩個文件作爲輸入文件。下面一個例子: directory1 AB001.txt AB002.txt AB003.txt .... directory2 AB001.fasta AB002.fasta AB003.fasta .... 所以,我要遍歷超過5000 * .txt文件與相應的* .fasta文件(總是相匹配的前綴)。所有* .txt文件應該執行的命令是:

    -4熱度

    1回答

    我想如下修改如下程序: 第一行包含蛋白質的名稱和計數隨後的這種蛋白質的輸出線(如N) 接下來的N行中的每一行都包含一個匹配信息:GBoxes的位置和實際匹配(記住存在擾動和X的即通配符,允許)。 腳本: import csv import matplotlib.pyplot as plt import numpy as np # all G boxes def match(x,y):

    1熱度

    2回答

    我已經看過以前提過的關於在列表中保留'for循環'輸出的問題,但我似乎無法將其應用於我的函數。 也許有人可以給我一個關於我做錯了什麼的線索。 dna_seqs <- list('id1', 'ATGGCAATAACCCCCCGTTTCTACTTCTAGAGGAGAAAAGT', 'id2', 'TCCGTTAAGATATTCTTACGTGTGACGTAGCTATGTATTTTGCAGAGCTGGC

    1熱度

    1回答

    我要生成硒代半胱氨酸的標誌,但是當我選擇的選項與reduced_protein_alphabet我得到錯誤「但卻難免重複字母」 weblogo -f sc.txt -D fasta -o sc_logo -F pdf -a reduced_protein_alphabet -s large -n 100 -c chemistry

    1熱度

    1回答

    我是新手,嘗試使用snakemake(上週左右),以便處理較少的工作流細節,以前我編寫了自己的特定工作流程通過python。 我生成了一個小工作流程,其中的步驟之間將使用Illumina PE讀取並運行Kraken對他們。然後,我會解析Kraken輸出的輸出,以檢測最常見的物種(在一組允許範圍內),如果沒有提供物種值(使用snakemake運行-s test.snake --config R1_r