snakemake

    1熱度

    2回答

    我第一次使用snakemake爲了使用cutadapt,bwa和GATK(修剪;映射;調用)構建基本流水線。我想在包含在目錄中的每個fastq文件上運行這個管道,而不必在snakefile或配置文件中指定它們的名稱或任何內容。我想成功做到這一點。前兩步(cutadapt和bwa /修剪和映射)運行良好,但我遇到了一些GATK問題。 首先,我必須從bam文件生成g.vcf文件。我正在使用這些規則:

    1熱度

    1回答

    我有一個複雜的工作流程,我逐步擴展。最後的擴展導致AmbiguousRuleException。我試圖在以下示例中重現工作流程的關鍵結構: NUMBERS = ["1", "2"] LETTERS = ["a", "b", "c"] WORDS = ["foo", "bar", "baz"] CHOICES = ["yes", "no"] rule all: input:

    0熱度

    1回答

    這看起來可以在SnakeMake中鏈接參數。這是可以做的,還是會在並行環境中引起問題,並且應該使用PersistentDict來代替? rule a: params: a = "Param A", b="Param B" ... rule b: params: rules.a.params.b

    0熱度

    1回答

    我嘗試使用snakemake來繪製地圖,併合並一些從多條車道獲得的數據。 我有一些問題。我想這樣做是: *.gz> 432_L001.sam, 432_L002.sam > 432_L001.sorted.bam,432_L002.sorted.bam> 432.bam 所以從開始的fastq從單位創建樣品的關鍵的名稱UNIC bamfile。 config.yaml samples:

    2熱度

    1回答

    在snakemake中,推薦使用shell()函數執行多個命令的方式是什麼?

    1熱度

    1回答

    有沒有辦法訪問snakemake正在運行的snakefile的名稱?它似乎可以通過解析sys.argv進行訪問,但是我想知道是否有可用的變量包含這樣的環境信息?

    1熱度

    4回答

    有沒有辦法在.yaml文件中定義snakemake配置字符串,以便它可以包含{通配符}和{param}值,並且在shell命令中使用該字符串時,名稱爲>}替換爲「<名稱>」的實際值? 例如,假設要一個配置字符串定義字符串的格式作爲參數傳遞給一個程序來進行傳遞: RG:「ID:{ID} REP:{REP}」 其中上述文件位於.yaml文件中,ID和REP是通配符,shell命令將擴展字符串作爲參數傳

    0熱度

    1回答

    我對snakemake文件有這條規則。當我啓動輸入文件時,會從我的yaml文件中存在的所有輸入中填充。我希望爲bwa的每個進程填充一個單元密鑰。 在這裏你有規則和Yaml文件(不完整)和空運行結果。 rule bwa_mem: input: dt=expand("trim/{sample}/",sample=config['units']), forward_pa

    1熱度

    1回答

    我注意到我的備份rsync腳本花費了相當一段時間從.snakemake/metadata文件夾複製隨機名稱的東西。 這些文件用於什麼? 我可以在snakemake運行完成後安全地擦除它們,還是snakemake需要正確執行下一次運行? 更一般地說,是否有關於snakemake在.snakemake文件夾中創建的文件的一些文檔?

    0熱度

    1回答

    即使某些規則失敗,我也希望能夠讓我的smakemake工作流繼續運行。 例如,我使用各種工具來執行ChIP-seq數據的峯值調用。但是,某些程序在無法識別峯值時會發出錯誤。我寧願在這種情況下創建一個空的輸出文件,而不是讓蛇形失敗(就像一些峯值呼叫者已經這樣做)。 使用「shell」和「run」關鍵字處理這種情況是否有類似snakemake的方式? 感謝