我正嘗試使用生存包中的Surv
和survfit
函數來運行生存分析。我的大部分數據都被截斷,我不確定是否將它輸入到Surv
函數中。我的反應變量是從橋樑被分類爲不足時開始到崩潰結束時的時間(以年爲單位)。我可以追溯從2012年到2012年的每座橋樑的不足狀況,但沒有更多。審查發生是因爲許多橋樑從倒塌到1992年被歸類爲不足之處,因此我不知道它們何時變得不足,因此我不知道它們的真實「壽命」(從缺陷分類崩潰)。例如說,一個 橋塌了於1995年,被列爲1995年,1994年,1993年爲不足,1992年,是可能的,它是第一個列爲1992年爲不足,這是 也有可能是已經分類自1984年以來一直不足。因此,我認爲我的審查被認爲是截斷的。如何使用左截斷數據的R中的「生存」包和Surv函數?
一些示例數據:
Year0 = c(1992, 1992, 1999, 1992, 1993, 2007, 2005, 1992) # The years when each bridge was first observed as being deficient.
Year1 = c(1993, 1994, 2002, 1996, 2004, 2012, 2011, 2000) # The years in which each bridge collapsed
Defyears = Year1 - Year0 + 1 # The number of years for wich I can observe each bridge being deficient
time1 = Year0 - 1992 # Since I want the time scale to be from 0 to 21 instead of 1992 - 2012, I subtract 1992 from each time observation.
# This now becomes the beginning point for the lifetime of each bridge.
time2 = Defyears + time1 # This is the ending point of the lifetime of each bridge.
n = length(time2)
注意,四出於八個橋的是左截斷,橋1,2,4和8。我 可以不完全觀察時,被第一分類爲缺陷。對於橋樑 3,5,6和7,我知道它們的確切壽命,因爲它們在1992年之後變得不足,因此這些觀察結果沒有被審查。
我再適合以下型號:
bridges = survfit(Surv(time = time1, time2 = time2, event = rep(1,n)) ~ 1) # I do "event = rep(1,n)" because each bridge collapsed.
我只是不知道,這個模型是正確的。首先,在文檔中, 表示「時間」用於右刪失數據或間隔刪失數據的開始時間。另一方面,我不明白這個模型如何解釋未被審查的觀察結果。任何人都可以告訴我,如果這是正確的,如果沒有,我需要改變以及爲什麼。 任何幫助,不勝感激。非常感謝!
這裏需要的是沒有崩潰的橋樑上的數據。 –