fastq

    0熱度

    1回答

    我試圖將fastq轉換爲fasta而不先做一個質量過濾器。當我嘗試使用fastx工具包來運行此轉換時,它在運行到低質量基礎時會給我一條錯誤消息,並終止轉換,以便轉換後的輸出很早結束。 (錯誤表示質量得分低於-30)。 然後,我嘗試使用此論壇中較早發佈的sed解決方案,介紹如何使用sed轉換爲fasta。該生產線是這樣的: sed -n '1~4s/^@/>/p;2~4p' 行我輸入端子爲: s

    2熱度

    3回答

    我有一個命令我要對所有文件夾的文件中運行的一部分,該命令的語法如下: tophat -o <output_file> <input_file> 我希望做的是一個腳本它循環遍歷任意文件夾中的所有文件,並使用輸入文件名創建相似但不同的輸出文件名。文件名看起來是這樣的: input name desired output name path/to/sample1.fastq path/to

    1熱度

    3回答

    我有兩個單獨的文本文件,每個都具有相同的確切格式。我可以grep FILE1.txt查找特定的搜索詞並輸出每個匹配的行號。行號按數字順序輸出到文件或變量。 我想要使用每行號碼,並從FILE2.txt以數字順序打印該行,以單個OUTPUT.txt。有沒有人知道一種方式,使用awk或sed來做到這一點? 我有一個字符串變量$ linenumbers與25 26 27 28 我用下面的命令值: for

    1熱度

    1回答

    我試圖讓下面的perl腳本工作。首先,讀取fastq文件,然後使用該文件通過多個程序進行分析。 代碼: use warnings; use PBS::Client; $directory = $ARGV[0]; opendir(DIR, $directory); @files=(); while ($file = readdir(DIR)) { push(@files

    0熱度

    2回答

    我做的這些文件的測試: comp900_c0_seq1_Glicose_1_ACTTGA_merge_R1_001.fastq comp900_c0_seq1_Glicose_1_ACTTGA_merge_R2_001.fastq comp900_c0_seq2_Glicose_1_ACTTGA_merge_R1_001.fastq comp900_c0_seq2_Glicose_1_ACT

    0熱度

    2回答

    我寫一個GNUmakefile創建工作流來分析一些生物序列數據。數據採用稱爲fastq的格式,然後經過許多清理和分析工具。我附上了我目前所寫的內容,這些內容從清潔前的質量控制到後來的質量控制都一路走來。我的問題是我不確定如何讓'fastqc'命令運行,因爲它的目標不是工作流中其他任何步驟的依賴項。 %_sts_fastqc.html %_sts_fastqc.zip: %_sts.fastq

    0熱度

    1回答

    我有一些來自Illumina NextSeq運行的.fastq文件。許多序列具有polyA片段,這使得它們映射變得複雜。我想刪除的連續十A的所有序列,並一直在努力這樣做,使用fastx_clipper如下: ha1c6n8$ fastx_clipper -l 32 -Q33 -n -v -a AAAAAAAAAA –i FR0826_S1_L004_R1_001.fastq –o FR0826_L

    1熱度

    2回答

    我有這樣(文件的部分)的fastq文件: @A80HNBABXX:4:1:1344:2224#0/1 AAAACATCAGTATCCATCAGGATCAGTTTGGAAAGGGAGAGGCAATTTTTCCTAAACATGTGTTCAAATGGTCTGAGACAGACGTTAAAATGAAAAGGGG + \\YYWX\PX^YT[TVYaTY]^\^H\`^`a`\UZU__TTbSbb^

    1熱度

    2回答

    假設我有一個命令command.py,它將文件File_01_R1.fastq到File_01_R2.fastq配對在一起。在單個對上執行的命令如下所示: command.py -f File_01_R1.fastq -r File_01_R2.fastq 但是,我有很多文件,每個文件都帶有R1和R2版本。我怎麼能告訴這個命令去瀏覽我擁有的每個文件,所以它也執行 command.py -f F

    0熱度

    1回答

    command.py,它將兩個配對文件CA01_S1_R1.fastq和CA01_S1_R2.fastq合併在一起。然後將結果打印到新目錄paired.out中,並將結果文件​​命名爲​​。完整的命令將讀取 command.py -f CA01_S1_R1.fastq -r CA01_S1_R2.fastq -o paired.out 不過,我想很多的文件執行該命令,然後都保存在同一目錄下的輸出。