2016-02-21 40 views
5

我想用R中的一個預測因子來估計指數危險模型。出於某種原因,當我使用glm泊松估計它時,我得到的符號相反與偏移日誌噸,當我只是使用生存包倖存功能。我相信解釋是非常明顯的,但我無法弄清楚。指數危險模型係數的相反方向(具有存儲和glm泊松)

t <- c(89,74,23,74,53,3,177,44,28,43,25,24,31,111,57,20,19,137,45,48,9,17,4,59,7,26,180,56,36,51,6,71,23,6,13,28,16,180,16,25,6,25,4,5,32,94,106,1,69,63,31) 
d <- c(0,1,1,0,1,1,0,1,1,0,1,1,1,1,0,0,1,0,1,1,1,0,1,0,1,1,0,0,1,1,1,1,1,1,1,1,1,0,1,1,1,1,1,1,1,0,1,1,1,1,1) 
p <- c(1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,0,0,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,0,0,0,1,1,1) 
df <- data.frame(d,t,p) 

# exponential hazards model using poisson with offest log(t) 
summary(glm(d ~ offset(log(t)) + p, data = df, family = "poisson")) 

產地:

Coefficients: 
      Estimate Std. Error z value Pr(>|z|)  
(Intercept) -5.3868  0.7070 -7.619 2.56e-14 *** 
p    1.3932  0.7264 1.918 0.0551 . 

相比

# exponential hazards model using survreg exponential 
require(survival) 
summary(survreg(Surv(t,d) ~ p, data = df, dist = "exponential")) 

產地:

  Value Std. Error  z  p 
(Intercept) 5.39  0.707 7.62 2.58e-14 
p   -1.39  0.726 -1.92 5.51e-02 

爲什麼係數的方向相反,我將如何解釋結果? 謝謝!

+0

好的,所以我開始閱讀[this](http://www.math.ku.dk/~richard/courses/regression2014/survival.html)。泊松模型估計危害,而倖存模型是一種加速失效時間模型。由於我使用的是指數模型而不是威布爾,所以係數恰好相反。儘管如此,我仍然對這個解釋留有餘地。 – fmerhout

+2

這很簡單。這兩個模型中的響應變量是不同的。對於泊松來說,你正在模擬事件計數/狀態(因爲只有0-1),因此係數就像'風險'或'危險',而在'倖存'中你模擬時間,所以係數就像'生存'(日誌時間比例確實),這與「風險」呈負相關。風險/危險越高,生存時間越短。 – Eric

回答

0

在第二個模型中,p的增加值與預期存活下降相關。在第一種模型中,具有長t值的增加的p意味着更高的存活機會和更低的風險。風險變化和平均生存時間價值的必然性是相反的。絕對值相同的事實來自數學身份log(1/x)= -log(x)。風險與指數模型中的平均壽命(精確地)成反比。

+0

謝謝,這正是我正在尋找的。當然,還有一些功勞也應該是首先提供這個答案的@Eric--而不是一個答案。 – fmerhout

+0

你也可以看看:'summary(survreg(Surv(t,d)〜p,data = df,dist =「weibull」,scale = 1))'注意''survreg'的Examples部分的註釋 –