bioinformatics

    0熱度

    1回答

    目標:mas5正常化數據。 問題:當我嘗試以下方法R代碼裏面,我得到這個 error: unable to find an inherited method for function bg.correct for signature ExpressionFeatureSet, character 我有這麼看着,發現以下幾點:What does this mean: unable to find

    1熱度

    1回答

    我是新來snakemake,並希望能夠通過trim_galore採取任何一對.fq文件或一對文件,並運行他們得到一副修剪的輸出文件。沒有給我所有的Snakefile,我有下面的醜陋的解決方案,我剛剛複製規則並更改輸入。什麼會是更好的解決方案? #Trim galore paired end trimming rule for unzipped fastqs: rule trim_galore_u

    1熱度

    1回答

    從VIPREADME.md文件: 安裝 一臺機器上安裝VIP的步驟如下: > git clone https://github.com/keylabivdc/VIP > cd VIP > cd installer > chmod 755 * > sudo sh dependency_installer.sh > sudo sh db_installer.sh -r [PATH]

    2熱度

    1回答

    我想用它來轉換一堆標識符,但我需要確切地知道哪個分類等級被分配給每個分類標準代碼。下面顯示的是一個有意義的轉換示例,但我不知道如何標記某些分類調用。基本的分類等級是:(域,王國,門,類,次序,家庭,屬和物種)https://en.wikipedia.org/wiki/Taxonomic_rank。 對於大多數情況下,它很容易,但在細菌的亞種和菌株的情況下,這可能會引起混淆。 如何獲得ete3來指定

    0熱度

    1回答

    我正在配置Blast +在我的mac上(os sierra)並且在配置我也在本地下載的nr和nt數據庫時遇到了問題。我正在嘗試關注NCBI的指令here,並且正在執行配置和執行步驟。 他們說改變我的.bash_profile,以便它說: export PATH=$PATH:$HOME/Documents/Luke/Research/Pedulla\ 17-18/blast/ncbi-blast-2

    18熱度

    4回答

    我特別關注R,Perl和shell。但任何其他編程語言也可以。 問題 有沒有一種方法,以在視覺上或程序檢查和指數基於正則表達式匹配的字符串?這是爲了引用第一個正則表達式及其第二個正則表達式的結果,以便能夠修改匹配字符串的一部分併爲該特定部分編寫新規則。 https://regex101.com確實可視化某個字符串如何匹配正則表達式。但它遠非完美,對於我的龐大數據集效率不高。 問題 我有我的第一個正

    2熱度

    1回答

    我正在使用Python 2.6.6,並且我試圖刪除中的,它們與file1中的讀取重疊(即相同)。這裏是代碼我想實現: ref_reads = SeqIO.index("file1.fastq", "fastq") spk_reads = SeqIO.index("file2.fastq", "fastq") for spk in spk_reads: if spk in ref_r

    1熱度

    1回答

    我想用命令system()在R中運行shell腳本(BLAST + in NCBI),但它似乎只使用一個線程,即使我在shell腳本中設置了多個線程。在這種情況下,我應該怎麼做才能使用多線程? 的代碼是 system("blastp -query query.fasta -db db.fasta -num_threads 16 -outfmt \"6 qseqid sseqid pident pp

    0熱度

    1回答

    我想使用gatk重新校準使用對樣本(腫瘤和正常)。我需要使用熊貓來解析數據。這就是我所寫的。 expand("mapped_reads/merged_samples/{sample[1][tumor]}/{sample[1][tumor]}_{sample[1][normal]}.bam", sample=read_table(config["conditions"], ",").iterrows

    0熱度

    1回答

    我想使用snakemake製作一個生物信息學流水線,並使用Google搜索它並閱讀文檔和其他內容,但是我仍然不知道如何使它工作。 這是我的一些原始數據文件。 RAWDATA/010_0_bua_1.fq.gz,RAWDATA/010_0_bua_2.fq.gz RAWDATA/11_15_ap_1.fq.gz,RAWDATA/11_15_ap_2.fq.gz ...他們都是配對的文件。) 這裏是我