我有一個SAS數據集,看起來像這樣:拆分SAS數據集
id | dept | ...
1 A
2 A
3 A
4 A
5 A
6 A
7 A
8 A
9 B
10 B
11 B
12 B
13 B
每個觀察代表一個人。
我想將數據集分成「團隊」數據集,每個數據集最多可以有3個觀察值。
對於上述示例,這意味着要爲部門A創建3個數據集(其中2個數據集包含3個觀察值,第3個數據集包含2個觀察值)。以及B部分的2個數據集(1個包含3個觀測值,另一個包含2個觀測值)。
像這樣:
第一個數據集(deptA1):
id | dept | ...
1 A
2 A
3 A
第二個數據集(deptA2)
id | dept | ...
4 A
5 A
6 A
第三數據集(deptA3)
id | dept | ...
7 A
8 A
四集(deptB1)
id | dept | ...
9 B
10 B
11 B
第五數據集(deptB2)
id | dept | ...
12 B
13 B
我使用的完整數據集包含成千上萬的觀察與超過50個科指南我可以計算出每個部門需要多少個數據集,我認爲一個宏是最好的方法,因爲所需數據集的數量是動態的。但我無法弄清楚創建數據集的邏輯,以便它們最多有3個觀察值。任何幫助讚賞。
爲什麼你想要像這樣拆分數據集?一般來說,將數據保存爲許多數據集是很糟糕的做法 - 這很難處理,必須運行50次,並且必須對所有50個數據集進行準確的更改。如果你想由團隊做一些分析,SAS有一個非常強大的概念,稱爲「BY」語句 - 只需創建一個新變量,爲其分配團隊價值,然後任何分析都可以由團隊完成; ,並且就像您有50個不同的數據集一樣 - 只是在一個物理數據集中。例如,請參閱http://goo.gl/tfwcr。 – Joe 2013-02-19 15:55:16