1
我有一個大的SAS數據集,我想隨機分配觀察到不同的測試和對照組。觀察爲SAS數據集隨機分配觀察到測試或對照
20%的人有被控制 5%將是Test1的 75%將Test2的
Basicaly,
obs
1
2
3
4
5
將成爲
obs cell
1 control
2 test2
3 test2
4 test1
5 test2
我會怎麼做那?
謝謝
我有一個大的SAS數據集,我想隨機分配觀察到不同的測試和對照組。觀察爲SAS數據集隨機分配觀察到測試或對照
20%的人有被控制 5%將是Test1的 75%將Test2的
Basicaly,
obs
1
2
3
4
5
將成爲
obs cell
1 control
2 test2
3 test2
4 test1
5 test2
我會怎麼做那?
謝謝
PROC SURVEYSELECT
是這樣做的基本方法。但是,Surveyselect不允許一次選擇3組。
您可以在數據步驟中執行此操作,也可以使用SURVEYSELECT兩次;一次挑選第一組(20%),然後從未選中選擇第二組(75%/ 80%,93.75%),然後仍然未選中組3。
在datastep中,這不是非常糟糕難;您可以只分配一個隨機值,按隨機值對數據進行排序,然後將第一個5%的記錄作爲1,將(全部)記錄的下一個20%記錄爲2,並將最後的75%記錄爲3;或者可以對第三組使用k/n取樣進行一些修改。