2016-07-26 33 views
0

(對不起英文)我目前正在研究主管部門的病葉長度,所以我有一個數據庫,其中已經把長度,日期和其他成千上萬片樹葉的信息。我是這種類型分析的完整初學者。最後,我應該能夠告訴病假在病假第X天以後發病的百分比。我試圖使用生存分析包(生存)來簡化我的工作。到目前爲止,我能夠回答我的問題,但我沒有考慮到審查。我有一個0的數據已經被審查的數據和1的數據沒有。在其他任何事情之前,我試圖獲得數據的審查已被糾正的生存陰謀。如果我正確理解了這個原則,這意味着這個情節將成爲每個病假已經結束的預測情節。這裏是我正在使用的代碼,但我很確定我沒有用正確的方式。我也不知道我是否應該使用cox或其他東西。得到的陰謀考慮到生存分析的審查

好吧在時間2013我有我的葉子的長度,在event2013我有0審查數據和1數據不是。包含所有數據的數據框稱爲mydata。

我使用這段代碼得到的情節是我在找什麼?

s <- Surv(time2013,event2013) 
fKM <- survfit(s ~ 1,data=mydata) 
plot(fKM,conf.int=FALSE) 

回答

0

那麼,它可能***我想嘗試的第一件事情,但有那麼多的東西,這方面的....

1)什麼是你想怎麼辦?這是純粹的探索,還是你在測試一些假設/理論/假設?

2)被審查字段中是否包含沒有病假的人,或者那些從未返回的人?如果他們在數據最後一天結束之前死亡,如果您假設病假中仍然活着的人受到同樣的審查,這會如何影響事情?

3)您還有什麼其他信息,以及您可以在公式的右側添加哪些協變量。這個人的性別和年齡似乎是值得的。你有沒有服務年資,資歷等級,以前的病假期數?

我會再回到這個.......我一直在招手準備晚飯:-)

+0

我想編輯這篇文章來回答你的問題,但一旦我做我意識到這個問題現在完全不同了,所以我回答了你的問題,並在[另一篇文章]中更新了我的問題的狀態(http://stackoverflow.com/questions/39014180/what-r-packages-or-algortihms-would-you-use-在那種類型的分析中)。 – PaoloH