2012-07-12 47 views
2

我在使用biomaRt軟件包時遇到了問題,當時我正在查找entymetrix hgu133a探針組ID的entrez ID。例如biomaRt找不到「206323_x_at」。
當我列出affy_hg_u133a列表中的所有探針ID時,只有19872個探針ID,但HGU133a(或帶有對照探針的22313)上有22245個探針。腳本有問題或者這個數據庫不完整?R:biomaRt包缺失探針ID?

謝謝!

library(biomaRt) 
mart<-useMart("ensembl", dataset="hsapiens_gene_ensembl") 
affyids="206323_x_at" 
getBM(attributes=c('affy_hg_u133a', 'entrezgene'), filters = 'affy_hg_u133a', values = affyids, mart = mart) 
[1] affy_hg_u133a entrezgene 
<0 rows> (or 0-length row.names) 

hgu133a<-getBM(attributes='affy_hg_u133a', mart = mart) 
dim(hgu133a) 
[1] 19872  1 

回答

1

它似乎不適用於此探針組。我們可以得到一個答案與

library(hgu133a.db) 
myprobeset = "206323_x_at" 
genes <- mget(myprobeset,hgu133aENTREZID) 

我們可以測試另一種探針

affyids = c("218471_s_at") 
getBM(attributes = c("affy_hg_u133a", "entrezgene"), filters = "affy_hg_u133a",values = affyids, mart = ensembl) 

myprobeset = "218471_s_at" 
genes <- mget(myprobeset,hgu133aENTREZID) 

因此,這似乎是在數據的兩個不同的來源給出不同的答案的情況。這種情況偶爾會發生。

0

probemapper包也可用於此特定需求。它在R中可用,並且具有在線界面。

以下是爲您的特定基因的結果: qbrc.swmed.edu/probealignment/#probe=1005849

解讀:供應商和Bioconductor的同意,探頭對準到Entrez的ID 4983,但BLAST顯示了一些其他潛在的路線(這可能可以,如果你忽視只關心賣方的註釋)。

+0

謝謝,你的包似乎很有用,有人在已發表的文章中使用它(除了你的)? – sztup 2012-07-12 18:34:39

+0

我們已經在網絡服務上看到了相當多的流量,但我並不知道目前使用它的任何出版物。 – 2012-07-12 19:28:26