2015-05-18 57 views
1

假設我有具有以下信息的數據集兩個樣本t檢驗格式化數據每個數字(例如,有多少人購買的產品數量)爲R上

2 5 10 

比方說,我會爲每個2組以上信息:控制和測試數據。

我如何格式化數據,使得它看起來像這樣:

controldata<-c(1,1,2,2,2,2,2,3,3,3,3,3,3,3,3,3,3) 

(每個號碼*頻率列爲矢量)

testdata<- (similar to above) 

,這樣我可以執行兩個獨立R的樣本t檢驗?

如果我甚至不需要使它們成爲矢量/如果有其他巧妙的方法來格式化數據以執行t檢驗,請讓我知道!

如果向量像上面那樣小,這將是簡單的,但是我可以使每個數字的頻率> 10000。

P.S. 控制和測試數據具有不同的樣本大小。

謝謝!

+0

什麼代碼,你到目前爲止寫的嗎? – byako

回答

0

使用rep。使用您的數據上面

rep(c(1, 2, 3), c(2, 5, 10)) 
# [1] 1 1 2 2 2 2 2 3 3 3 3 3 3 3 3 3 3 

或者,你的情況

control_data = rep(n_bought, frequency)