2016-01-07 60 views
1

我想從一組病例中選擇其中一個變量的值爲1的病例。只從總體子集中選擇隨機病例似乎是可能的,而不是一種病症。SPSS在變量上有條件時選擇隨機病例

這是我的數據集的一個簡單的例子:

case 1. value 0 
case 2. value 1 
case 3. value 0 
case 4. value 1 
case 5. value 1 
case 6. value 1 
case 7. value 0 

所以,我想借鑑那些對變量類別中的值爲1的情況下隨機例(50%)。這將使情況1,3和7脫離隨機選擇。

一個選項是將這些值爲1的情況轉移到另一個數據庫,然後選擇隨機情況。但是,我想保留數據庫中的所有情況。

有誰知道這是否可能在SPSS?

+0

改進的格式 –

回答

0

而是談論您如何做到這一點,如果你一步通過下面的例子中,應該提供足夠的信息,如何做到這一點的:

DATA LIST FREE/X1 TO X3 D1. 
BEGIN DATA 
1 2 3 0 
4 5 6 1 
7 8 9 1 
1 2 3 0 
4 5 6 1 
7 8 9 1 
1 2 3 0 
4 5 6 1 
7 8 9 1 
1 2 3 1 
4 5 6 1 
7 8 9 0 
1 2 3 1 
4 5 6 1 
7 8 9 0 
END DATA. 
DATASET NAME DS1. 
AGGREGATE OUTFILE=* MODE=ADDVARIABLES /BREAK=D1 /CountN=N. 
COMPUTE Rand=RV.UNIFORM(0,1). 
RANK Rand BY D1. 
COMPUTE FILTER=D1=1 and RRand<=(CountN/2). 
SORT CASES BY D1 Rand. 
0

爲什麼不直接使用一個簡單的計算像 計算保留=值EQ 1和rv.uniform(0,1)GE .5。 FILTER BY保持。 (如果保留數據集中的所有案例,但僅使用過程中的保留案例)或 SELECT IF。刪除未選定的案例。

+0

我想到了這個最初只是然後意識到你可能不會隨機產生選擇50%的案例。 –

+0

該公式將對所選病例的50%進行隨機變化。如果它需要恰好50%,則需要採取其他措施。 – JKP