2013-12-10 135 views
1

我想使用插補來替換數據集中的缺失值。我有一些限制,例如我不希望虛擬變量x1小於我的兩個其他變量的總和,比如說x2 and x3。我也希望被0 or 14 or >= 14 and推算出來,x2被0 or 16 or >= 16推算出來。我嘗試在spss中定義這些約束,例如多重插補,但是在spss中我只能定義最大值和最小值。有沒有什麼方法可以在spss中定義furthur約束,或者您是否知道任何R包讓我可以定義這些約束來填補缺失值?R中缺失值的多個插補

x1 =c(21, 50, 31, 15, 36, 82, 14, 14, 19, 18, 16, 36, 583, NA,NA,NA, 50, 52, 26, 24) 
    x2 = c(0, NA, 18,0, 19, 0, NA, 0, 0, 0, 0, 0, 0,NA,NA, NA, 22, NA, 0, 0) 
    x3 = c(0, 0, 0, 0, 0, 54, 0 ,0, 0, 0, 0, 0, 0, NA, NA, NA, NA, 0, 0, 0) 
    dat=data.frame(x1=x1, x2=x2, x3=x3) 
    > dat 
     x1 x2 x3 
    1 21 0 0 
    2 50 NA 0 
    3 31 18 0 
    4 15 0 0 
    5 36 19 0 
    6 82 0 54 
    7 14 NA 0 
    8 14 0 0 
    9 19 0 0 
    10 18 0 0 
    11 16 0 0 
    12 36 0 0 
    13 583 0 0 
    14 NA NA NA 
    15 NA NA NA 
    16 NA NA NA 
    17 50 22 NA 
    18 52 NA 0 
    19 26 0 0 
    20 24 0 0 
+0

這絕對是可能的,但展示答案需要一些數據,所以請提供一些示例數據。 – Thomas

+0

你只有整數值嗎? – agstudy

+0

@ Thomas。我提供了示例數據。 – rose

回答

0

如果您只整數值,你可以這樣做:

N <- 5 
set.seed(1) 
dat <- data.frame(x1 = sample(1:10,N,rep=TRUE), 
        x2 = sample(1:10,N,rep=TRUE), 
        x3 = sample(c(1,NA),N,rep=TRUE)) 

> dat 
    x1 x2 x3 
1 3 9 1 
2 4 10 1 
3 6 7 NA 
4 10 7 1 
5 3 1 NA 
## x3 < sum(x1,x2) 
transform(dat,x3 =ifelse(is.na(x3),sample(seq(x1+x2-1),1),x3)) 
    x1 x2 x3 
1 3 9 1 
2 4 10 1 
3 6 7 3 
4 10 7 1 
5 3 1 3 
## x3 in c(0,14) 
transform(dat,x3 =ifelse(is.na(x3),sample(c(0,14),1),x3)) 
    x1 x2 x3 
1 3 9 1 
2 4 10 1 
3 6 7 14 
4 10 7 1 
5 3 1 14 
0

那麼,你當然可以這樣做,在SPSS用簡單的轉換邏輯,但我本來以爲一會希望根據已知值的分佈進行估算。