我有兩個數據集(培訓和驗證)用於構建和驗證Cox模型。使用外部數據的生存模型驗證
隨着訓練數據集I使用逐步選擇方法擬合了一個cox模型。
模型中的重要變量是包含在驗證模型中的唯一變量。 這是正確的方法嗎?
在驗證模型時,我意識到變量在驗證模型中並不重要,並且cox模型的假設也不成立(我檢查了驗證數據的假設)。 我是否應該忽略變量不重要的事實,並繼續使用驗證數據中的模型假設對問題進行修正?
第三,在培訓和驗證數據中,我有一個變量「治療」與三組。在訓練中,這些組是標準,新葯和混合物,而在驗證數據中,這些組是標準,新葯和X(是一種與訓練數據中的混合物不同的處理)。 在模型中包含這個變量是否正確,或者是否應該消除不匹配的組;來自訓練數據的混合物和來自驗證數據的X,還是我應該這樣工作?我不確定這是如何影響我的分析的。
感謝您的回覆。