要獲得probeID和基因符號之間的映射,您需要在biomaRt屬性中包含probeID。
這裏是我如何做它採用安捷倫芯片我的一些工作:
genes<-c("A_23_P10060", "A_23_P10091", "A_23_P103951", "A_23_P10525", "A_23_P105732", "A_23_P10605", "NM_005325")
library(biomaRt)
ensembl<-useMart("ensembl", dataset="hsapiens_gene_ensembl")
ensembl.id<-grep("ENST", genes, value=T)
agilent.df<-getBM(attributes = c("hgnc_symbol","efg_agilent_wholegenome_4x44k_v1"), filters=c("efg_agilent_wholegenome_4x44k_v1"),values=genes, mart=ensembl)
genes<-merge(x = as.data.frame(genes),y = agilent.df, by.y="efg_agilent_wholegenome_4x44k_v1", all.x=T, by.x="genes")
有一個非常好的biomaRt tutorial可引導您雖然同樣的過程。如果你運行這個代碼,你會注意到一個探針對於一個hgnc_symbol會有「」,這是因爲它存在於合奏集市中,但沒有指定的基因符號。
當你設置'uniqueRows = FALSE',我的意思是'getBM(attributes = ...,uniqueRows = FALSE)',你有什麼? – agstudy 2013-03-14 18:26:08
我得到了相同基因符號的重複。這對插入那些未找到的探針的na值沒有幫助。 – user794479 2013-03-15 04:02:40
我不清楚你試圖這麼做嗎?你可以把你的'getBM'重新請求添加到OP中,你會得到什麼結果。快速閱讀文檔,你應該得到一個data.frame與2列... – agstudy 2013-03-15 04:13:16