2013-12-20 27 views
1

您好,我對BioStrings的使用非常陌生,但我可以看到它的力量的一瞥。我希望有人能幫助我開始:Biostrings:使用帶有vmatchPattern結果的XStringSet類對象的子查詢結果

我一個fastafile加載到XStringSet類對象

genes <- readDNAStringSet(File = "filename", format = "fasta", use.names = T) 

我搜索一個特定的字符串:

view <- vmatchPatter(pattern = "CCGGA", genes) 
matches <- unlist(view, recursive = T, use.names = T) 
m <- as.matrix(matches) 

我知道有一個包含純的基質比賽的所有地點。這是比較容易使用下面的代碼獲得匹配的特定基因背景:

subseq(genes["genename",], start = m["genename",1], width = 20) 

不過,我敢肯定有一個非常快速的方式來獲得在所有基因的所有上下文快速的方式。同時考慮到某個DNA序列中可能的多重匹配

有人能請我開啓嗎?

+0

你會得到關於在Bioconductor的[郵件列表] Bioconductor的包明確的答案(HTTP ://bioconductor.org/help/mailing-list/mailform/) –

+0

感謝您的提示,我已經在那裏轉發了我的問題。對於這樣一個具體的問題,這個平臺可能太寬泛了。 – Timtico

回答

0

我已經找到了解決方案,因爲它忽略了多個匹配,所以這是一半工作的解決方案。我敢肯定有一個更symantic的解決方案,是不可或缺的Biostrings但它爲我工作至今:

subseq(genes[rownames(m),], start = m[rownames(m),1], width = 20) ### for multiple genes