2011-12-07 22 views
2

我現在用R來做雙樣本t檢驗。 我看到很多的腳本示例互聯網上象下面這樣:上傳大數據時使用R做t檢驗

#!/usr/bin/env Rscript 

dataset.1= c(498, 460, 468, 458, 530, 482, 528, 598, 456) 
dataset.2= c(596, 422, 524, 454, 538, 552, 478, 564, 556) 


t.test(dataset.1, dataset.2, paired=T,conf.level=0.9) 

確定這個效果很好給我。但我的問題是:我有一個巨大的數據輸入象下面這樣:

GENE CANCER1 CANCER2 CANCER3 NORMAL1 NORMAL2 NORMAL3 
gene1 123 232 322 898 988 899 
..... 
..... 
gene7000 233 434 434 897 676 654 

那我該怎麼這個數據(路徑+ xxx.txt)上傳到腳本?

另外更重要的是,我該如何特別指出腳本中的某些列? 說現在我希望比較data1=c(233,434,434,)data2=c(897,676,654) gene7000?

謝謝

+1

你在找read.table嗎? –

回答

1

它應該很簡單。您可以在命令行上將想要的任何參數傳遞給R腳本。你可以通過文件名,載體或列的數量等的名稱從R中得到的參數做這樣的事情:

arguments <- commandArgs(trailingOnly=TRUE) 

?commandArgs獲取更多信息。

1

R安裝附帶的R進口/出口手冊或可用的here有很多關於將數據存入R的不同方式的信息,這最好取決於數據的外觀和有多大它是。這可能與使用read.table函數一樣簡單,或者對於使用數據庫的大型數據集可能會更好。

如果使用read.table或類似的,然後你的數據將在一個數據幀,並且可以使用類似下面的代碼運行t檢驗(假設你的數據幀名爲MYDATA):

t.test(mydata$CANCER1, mydata$NORMAL1) 

運行help('[[')有關提取數據對象部分的更多細節。