我試圖在訂閱上模擬客戶生命週期。由於數據被審查,我將使用R的生存包創建一條生存曲線。如何將審查數據輸入到R的生存模型?
原來的訂閱數據集是這樣的..
id start_date end_date
1 2013-06-01 2013-08-25
2 2013-06-01 NA
3 2013-08-01 2013-09-12
其中我處理,看起來像這樣..
id tenure_in_months status(1=cancelled, 0=active)
1 2 1
2 ? 0
3 1 1
..in爲了養活生存模式:
obj <- with(subscriptions, Surv(time=tenure_in_months, event=status, type="right"))
fit <- survfit(obj~1, data=subscriptions)
plot(fit)
我應該把哪些東西放在tenure_in_months變量中,例如,訂閱今天仍然活躍 - 是否應該是直到今天的使用期限,還是應該是NA?
它應該一直持續到您收集您的數據的那一天,我想那是「今天」。 – drevicko