2013-04-16 85 views
4
Surrogate splits: 
    ##  bmi < 21.51 to the right, agree=0.858, adj=0.632, (0 split) 

據我所知,這種分裂發送例基於的< 21.51的BMI值的右子節點和具有類似的分裂到主變量(同意= 0.858)和結節雜質體積減少(adj = 0.632)。解釋r輸出RPART分類樹替代拆分

我不明白輸出的(0分割)部分? 另外,如果協議的值爲1,這是否可疑?

謝謝!

回答

4

如果您在第一個主要分割中丟失了10個例子,那麼rpart會嘗試使用代理分割對它們進行分類。 如果其中9個在您的第一個代理變量中不存在缺失,則rpart將使用此變量,並且您的rpart輸出中將有(9拆分),因爲該變量用於9次拆分。

如果您的數據也遺漏了您的代理變量,那麼您的輸出中將有(0 splits)

我不知道協議的精確計算,但如果你將有協議,那麼我想,在同一分類使用主變量時,作爲替代變量的結果。 如果您的代理變量是主變量的單調變換版本,則可能發生這種情況。