sequencing

    0熱度

    1回答

    我的理解是,配對末端從Illumina的HiSeq/MiSeq平臺讀取看起來是這樣的: R1: AAAAAACCCCCC R2: GGGGGGTTTTTT 當讀取R2發現是那些在R1中發現的反向互補。但是,對於我的測序數據,這似乎並不是這種情況。如果有幫助,我可以從下面的一個MiSeq運行中讀取一對。 R1: @M01814:86:000000000-A6MU9:1:1

    0熱度

    2回答

    我想編輯一個排序Fastq文件,並刪除只在某些字符位置重複的行。理想情況下,我將遍歷輸入文件中的每一行,並輸出一個只包含任何唯一字符集的單個實例的文件。 如下圖所示。我只想看看前6個字符,後6個字符和每行的中間字符的一部分,並且只保留三個序列的每個獨特組合的一個實例。 AAAAAACCCCCCCCCCCCTTTTTTTTTTCCCCCCCCAAAAAA Start by comparing to

    1熱度

    1回答

    我將GPS點與索引一起存儲 - 所以在這個問題中引用這些點時,它會看起來像這樣的GPS [0],GPS [1],其中GPS是GPS位置並且[n]是GPS位置陣列中的索引。 這裏是我會如何被存儲的位置(在這個例子中該陣列只包含11個地點): GPS [0] =道路的起點 - 總是在第一索引 GPS [ - 9]點以捕獲不是所有的[1:道路10] =端 - - 總是在最後一個索引 GPS [1 9]

    0熱度

    2回答

    我已經花了太多的時間在這,我期待的建議。我有非常大的文件(對於那些感興趣的人來說,Illumina測序運行的FASTQ文件)。我需要做的是不匹配的重複(存在於原始文件),該行的文件和打印,加上3個系在其下方爲兩個單獨的文件之間的共同模式。 Grep這樣做很好,但是文件大約18GB,並且它們之間的匹配速度很慢。我需要做的例子如下。 FILEA: @DLZ38V1_0262:8:1101:1430:2

    0熱度

    1回答

    我有一些來自Illumina NextSeq運行的.fastq文件。許多序列具有polyA片段,這使得它們映射變得複雜。我想刪除的連續十A的所有序列,並一直在努力這樣做,使用fastx_clipper如下: ha1c6n8$ fastx_clipper -l 32 -Q33 -n -v -a AAAAAAAAAA –i FR0826_S1_L004_R1_001.fastq –o FR0826_L

    0熱度

    2回答

    我試圖限制用戶通過測驗時可以嘗試的次數,而不管內容啓動次數。 我發現了一個先決條件規則,但我認爲這隻適用於當前的啓動嘗試。 有沒有人成功地做到這一點? sco很迷人。

    1熱度

    1回答

    我需要我的對齊文件都是bowtie和samtools格式,以便我可以在稍後的管道中將它們送入不同的程序。有什麼方法可以將sam對齊文件轉換爲bowtie對齊文件,反之亦然? 另一種方法是做兩次對齊,並讓領結程序以不同的格式輸出它。但是,這浪費了太多時間。

    -1熱度

    3回答

    我有一個表格,裏面包含左右鞋的混合物,其中一些是防水的。 我需要編寫一個查詢來按字母順序對它們進行排序,但是當名稱相同時,請使用左側/右側前面的防水列。 例如 +-------------------------+------------+------------+ | Shoe name | Waterproof | Left/Right | +--------------------

    0熱度

    1回答

    對於R,我真的很新,所以對不起,如果我沒有完全理解。 我有一個DF數據收集在幾個不同的領域,稱爲STAND。我需要爲從1:3運行的數據創建一個序列,但是當涉及到新的STAND號碼時,必須重新啓動序列。 下面是一些虛擬的數據 STAND TREE_SPECIES DIAMETER 1 101737 Pine 276 2 101737 Spruce 98 3 101737 Spruce

    0熱度

    1回答

    我想使用bwa mem將序列讀取與hg19引用進行比對,但是我的序列都有一個UMI(唯一分子標識符)。我用umitools像這樣: umitools trim --end 5 input.fastq NNNNNN > output.fastq 這再正常附加我的UMI序列中output.fastq文件名行,但是如果使用BWA MEM對準的時候,我得到的錯誤: paired reads have