2017-07-31 40 views
0

我在R.Biomart在R鍵rssnp轉換爲基因名

library(biomaRt) 

snp_mart = useMart("ENSEMBL_MART_SNP", dataset="hsapiens_snp") 
snp_attributes = c("refsnp_id", "chr_name", "chrom_start", 
"associated_gene", "ensembl_gene_stable_id", "minor_allele_freq") 

getENSG <- function(rs, mart = snp_mart) { 
results <- getBM(attributes = snp_attributes, 
       filters = "snp_filter", values = rs, mart = mart) 
return(results) 
} 

getENSG("rs144864312") 

    refsnp_id chr_name chrom_start associated_gene ensembl_gene_stable_id 
1 rs144864312  8 20254959    NA  ENSG00000061337 
    minor_allele_freq 
1  0.000399361 

下面的代碼我沒有背景,生物學,請原諒我,如果這是一個明顯的問題。我被告知rs144864312應該匹配基因名稱「LZTS1」。我上面的代碼主要來自互聯網。我的問題是我從哪裏提取基因名稱?我得到listAttributes(snp_mart)給出了所有可能的輸出列表,但我沒有看到任何給我的上述「基因名稱」。我從哪裏提取這個基因名稱使用biomart(並給出rs號)?先謝謝你。

PS:我需要爲500個條目(而不僅僅是1)這樣做。因此,爲什麼我創建了一個如上所述的簡單函數來提取基因名稱。

回答

0

首先,我認爲你的問題將會吸引更多的專業關注https://www.biostars.org/

不過,據我所知,現在你有ENSEMBL ID(ENSG00000061337),你只是一個步驟就可以獲取基因名稱了。如果你谷歌「如何將ensembl ID轉換爲基因名稱」,你會發現很多方法。在這裏我列出幾個選項:

  1. 使用:在合奏https://david.ncifcrf.gov/conversion.jsp
  2. 使用biomart:http://www.ensembl.org/biomart/martview/1cb4c119ae91cb34b2cd5280be0a1aac
  3. 下載與兩個基因的名稱和ENSEMBL ID表,並自定義您的查詢。你可能想從UCSC基因組瀏覽器下載它,這裏有一些說明:https://www.biostars.org/p/92939/

好運