2016-03-14 42 views

回答

0

您不應該需要將速率除以常量;事實上,這可能導致P值和顯着性水平錯誤。如果不同的觀察結果代表不同的人數/總暴露量,你應該做的是考慮暴露。您可以通過將您的響應建模爲每單位曝光率並將曝光值用作權重來實現此目的; 通過使用(對數)曝光作爲偏移。

請參閱my post on CrossValidated關於泊松迴歸中偏移量的作用。

+0

謝謝!所以我需要看起來被抽樣的人口數量? (費率不能單獨分析?) – Cenoc

+0

@Cenoc如果你沒有被採樣的數字,你會假設每個觀測值都佔1個單位的曝光量。這可能是正確的,但只有你知道你的數據...... –

+0

,這是完全有道理的。所以這個偏移量就是「log(100000/population)」,因爲這將把這個比率轉化爲個案數量 - 其中'population'是每一年暴露的人口數量,而'100000'考慮到發病率是每100000(人年) – Cenoc

0

泊松迴歸是一種預測正整數的方法。數據數據是數據嗎?如果您想通過泊松迴歸來預測速率,並且您沒有整數,則可以將速率舍入: glm((round(Cancer_Incidence_Rate/100000))~time, family = poisson) 您能否提供有關數據分佈的更多信息?

+0

如果您正在爲速率建模,即使「glm」發出抱怨,您也不希望輪迴迴應。 –