2017-01-09 74 views
0

在我的數據集中,用不同範圍表示的變量,比如說,Female_Age_Band被給出爲15-20,20-25,25-30,... &等等。但問題出在哪裏數據不可用,特定觀察標記爲「不可用」,這使得sas將該字段作爲字符讀取。所以我認爲這將使得在邏輯迴歸中很難調用這個變量。此外,還有一些分類字段有3個不同的指標0,但即使這些字段也有「不可用」標籤。在技術上無法取代零,因爲零可能是一個有效的值。使用Proc Logistic/Proc GAM

有人可以幫助解決方案嗎?

+1

您可以手動讀取字符並重新編碼,也可以用空格替換所有不可用的數據(查找/全部替換) – Reeza

回答

0

該問題比「不可用」更大,因爲「15-20」也將被讀爲字符。但是你不想用中間值替換它們,因爲這會讓事情變得很奇怪。你沒有XXX 17.5歲的人。

我會做的是使用一個數據步驟來重新編碼數據作爲統一分佈在每個年齡段和重新編碼「不可用」作爲。

(對不起,我剛收到一臺新電腦,正在等待新的SAS安裝,因此我現在無法顯示代碼)。