我想用R中的一個預測因子來估計指數危險模型。出於某種原因,當我使用glm泊松估計它時,我得到的符號相反與偏移日誌噸,當我只是使用生存包倖存功能。我相信解釋是非常明顯的,但我無法弄清楚。指數危險模型係數的相反方向(具有存儲和glm泊松)
例
t <- c(89,74,23,74,53,3,177,44,28,43,25,24,31,111,57,20,19,137,45,48,9,17,4,59,7,26,180,56,36,51,6,71,23,6,13,28,16,180,16,25,6,25,4,5,32,94,106,1,69,63,31)
d <- c(0,1,1,0,1,1,0,1,1,0,1,1,1,1,0,0,1,0,1,1,1,0,1,0,1,1,0,0,1,1,1,1,1,1,1,1,1,0,1,1,1,1,1,1,1,0,1,1,1,1,1)
p <- c(1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,0,0,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,0,0,0,1,1,1)
df <- data.frame(d,t,p)
# exponential hazards model using poisson with offest log(t)
summary(glm(d ~ offset(log(t)) + p, data = df, family = "poisson"))
產地:
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -5.3868 0.7070 -7.619 2.56e-14 ***
p 1.3932 0.7264 1.918 0.0551 .
相比
# exponential hazards model using survreg exponential
require(survival)
summary(survreg(Surv(t,d) ~ p, data = df, dist = "exponential"))
產地:
Value Std. Error z p
(Intercept) 5.39 0.707 7.62 2.58e-14
p -1.39 0.726 -1.92 5.51e-02
爲什麼係數的方向相反,我將如何解釋結果? 謝謝!
好的,所以我開始閱讀[this](http://www.math.ku.dk/~richard/courses/regression2014/survival.html)。泊松模型估計危害,而倖存模型是一種加速失效時間模型。由於我使用的是指數模型而不是威布爾,所以係數恰好相反。儘管如此,我仍然對這個解釋留有餘地。 – fmerhout
這很簡單。這兩個模型中的響應變量是不同的。對於泊松來說,你正在模擬事件計數/狀態(因爲只有0-1),因此係數就像'風險'或'危險',而在'倖存'中你模擬時間,所以係數就像'生存'(日誌時間比例確實),這與「風險」呈負相關。風險/危險越高,生存時間越短。 – Eric