2013-03-21 41 views
0

我有一個完整的臭氧數據集,其中包含一些缺失值。我想用SPSS進行單一插補來計算我的數據。爲了評估插補方法的準確性,我希望隨機模擬缺失的數據模式,其中5%,10%,15%,25%和40%的數據缺失。缺失數據和單個插補

有人可以教我如何使用SPSS做隨機缺失的數據模式嗎?

此外,有人可以告訴我如何獲得性能指標,如:平均絕對誤差,測定係數和均方根誤差,以檢查估計缺失值的最佳方法。

回答

0

不幸的是,我目前的SPSS支持不缺數據分析,所以我只能給一些一般性的建議。

首先:對於缺失的數據模式:只需轉到數據 - >選擇案例 - >隨機樣本並刪除所需數量的案例,然後運行插補。

如果您使用插補模塊,則您提到的值應由spss提供。有一本說明書: ftp://public.dhe.ibm.com/software/analytics/spss/documentation/statistics/20.0/de/client/Manuals/IBM_SPSS_Missing_Values.pdf

+0

感謝您的幫助和鏈接。那麼你是否知道如何獲得性能指標來測試適合度? – user2193634 2013-03-21 08:34:11

+0

沒有對不起 - 我沒有使用這個模塊2年,將不得不看到實際輸出.. – 2013-03-21 08:41:43

0

第一個問題的答案。假設你的研究變量是y,並且你想模擬變量y的缺失。這是根據您缺少的數據模式計算額外變量y_miss的示例代碼。

do if uniform(1) < .05. 
comp y_miss = $SYSMIS. 
else. 
comp y_miss = y. 
end if. 
+0

然後如何性能指標? – user2193634 2013-03-22 10:02:08

+0

你有配方如何計算指標? – djhurio 2013-03-22 11:21:37