2013-08-25 30 views
2

我想根據給定的k-mers列表掃描DNA序列列表;第k-mer的列表上的每個元素是一組相等的長度類似k聚體,它們看起來像如何在DNA序列列表中找到k-mers的發生

myKmer1 = C( 「TATGGGTTT」, 「TAAGGGTTT」,..., 「CAAGGGTTT」)

...

myKmer10 = C( 「GGATTCCAG」, 「CCATTCTTT」,......, 「CGATTCCTT」)

什麼軟件/ R-腳本可實現k聚體的名單出現每個序列 - 的結果應該是一個表如下所示:

k聚體發生表1:顯示的數k鏈節在序列

myKmer1 myKmer2 ... myKmer10

SEQ1 2 0 3

SEQ2 1 3 0

...

seq1000 0 1 0

k聚體發生表2:示出了在序列k鏈節的位置

myKmer1 myKmer2 ... myKmer10

SEQ1 111,888 0 123,456,3333

SEQ2 123 111223333 0

...

seq1000 0 1234 0

+0

對於Biostars這種類型的問題,您可能會得到更好的回覆 – blJOg

回答

1

如果k鏈節那你正在尋找的長度是相同的,那麼你可以使用Jellyfish和dump子命令給你所有長度爲k的kmers的數量。然後你可以解析你的特定kmers的輸出。另見。