2017-03-08 26 views
0

我正在使用校園犯罪率作爲自變量的項目。數據是高度積極傾斜的。我需要轉換數據才能實現正常分佈以運行OLS。但是,我知道如果我進行日誌轉換,我將失去所有犯罪率爲0的案例(代表沒有犯罪)。還有其他可行的解決方案轉化犯罪率

回答

1

儘管可以通過計算諸如log(1 + rate)之類的東西來避免案例的丟失,但無論如何,非負性界限可能會造成麻煩。您可以考慮使用帶有日誌鏈接響應比例的伽瑪的廣義線性模型(分析>廣義線性模型)。這也可以處理正確的傾斜問題。

但請注意,這是在OLS迴歸中攜帶正態假設的錯誤,而不是因變量。

+0

謝謝你的迴應。只是爲了澄清一下,如果整個模型本身滿足正態假設 - 通過基於殘差的Shapiro-Wilk檢驗證明,我不需要關心對原始數據進行歸一化? – user7441576

+0

如果預期的犯罪數量例如是1或零,那麼殘差在一方面是嚴重有界的,所以線性模型在那裏將會出錯。這就是爲什麼我建議伽馬與日誌鏈接。 – JKP