2014-08-28 22 views
1

我有一個大的SAS數據集,我想隨機分配觀察到不同的測試和對照組。觀察爲SAS數據集隨機分配觀察到測試或對照

20%的人有被控制 5%將是Test1的 75%將Test2的

Basicaly,

obs 
1 
2 
3 
4 
5 

將成爲

obs cell 
1 control 
2 test2 
3 test2 
4 test1 
5 test2 

我會怎麼做那?

謝謝

回答

1

PROC SURVEYSELECT是這樣做的基本方法。但是,Surveyselect不允許一次選擇3組。

您可以在數據步驟中執行此操作,也可以使用SURVEYSELECT兩次;一次挑選第一組(20%),然後從未選中選擇第二組(75%/ 80%,93.75%),然後仍然未選中組3。

在datastep中,這不是非常糟糕難;您可以只分配一個隨機值,按隨機值對數據進行排序,然後將第一個5%的記錄作爲1,將(全部)記錄的下一個20%記錄爲2,並將最後的75%記錄爲3;或者可以對第三組使用k/n取樣進行一些修改。

相關問題