2011-10-11 52 views
1

我在嘗試從GWAS catalog獲取特定疾病相關信息。這可以通過電子表格下載直接從網站完成。但我想知道如果我可以在R中以編程方式執行它,任何建議都將不勝感激。與R檢索GWAS信息

謝謝。

Avoks

回答

2

結帳功能download.file()和封裝rcurl(http://cran.r-project.org/web/packages/RCurl/index.html) - 這應該做你正在尋找

+0

感謝賴,我會檢查出來。 – Avoks

0

你將不得不首先下載.tsv文件並手動編輯它們。 這是因爲GWAS目錄文件包含HTML符號,如「Behçet's disease」(定義特殊的第四個字母)中的&#x000A7。該這些符號將被R解釋爲線的末端,因此,你會得到一個錯誤信息,如:

 
line 2028 did not have 34 elements 

所以,你首先downlad它,在純文本編輯器打開時,自動更換每空字符,才把它加載到R:

 
read.table("gwas_catalog_v1.0-associations_e91_r2018-02-21.tsv",sep="\t",h=T,stringsAsFactors = F,quote="")