**編輯,因爲我是doofus - 與更換,不無**生成按組的隨機數替換
我有一個大的肥胖型(> 50萬行)數據集421個基團,由兩個限定分組變量。樣品數據如下:
df<-data.frame(group_one=rep((0:9),26), group_two=rep((letters),10))
head(df)
group_one group_two
1 0 a
2 1 b
3 2 c
4 3 d
5 4 e
6 5 f
...等等。
我想要的是通過(group_one x group_two)中的成員資格的分層樣本的某個數字(k = 12,但該數字可能會有所不同)。每個組的成員資格都應該用一個新的列sample_membership來表示,該列的值爲1到k(現在再次是12)。我應該可以通過sample_membership進行子集化,並獲得12個不同的樣本,每個樣本在考慮group_one和group_two時都具有代表性。因此
最終數據會是這個樣子:
group_one group_two sample_membership
1 0 a 1
2 0 a 12
3 0 a 5
4 1 a 5
5 1 a 7
6 1 a 9
的思考?首先十分感謝!
你的標題說「沒有替換」,但你的問題沒有提到它。您是否想要取樣而不更換(並且您保證每個分組<= 12行)? – Gregor
這是一個錯誤。一定要更換。我對這種混亂表示歉意。 – seehuus
隨意編輯您的問題標題以糾正錯誤。 – Gregor