2014-01-16 92 views
0

後,我把我的響應變量的一個因素做as.factor(response),我跑:結果是矢量值,而不是標

tree = ctree(response~., data=trainingset) 

當我繪製這棵樹:它給了我矢量值y的在圖中作爲一個例子: Y =(0.095,0.905,0) 我注意到,3個值之和爲1。

但作爲一個問題是,實際的響應變量包括0,1值,只有99。

任何人都可以幫我解釋ctree陰謀這個載體嗎?謝謝!

在特定的代碼方面,它看起來像如下:爲每個類的

response = as.factor(data$response) 
newdata = cbind(predictor.matrix, response) 

ind = sample(2, nrow(newdata), replace=TRUE, prob=c(0.7, 0.3)) 
trainData = newdata[ind==1,] 
testData = newdata[ind==2,] 

tree = ctree(response~., data=trainData) 
plot(tree, type="simple") 
+1

這些都是爲每個類的後驗概率;即'1'類的後驗概率爲〜0.9(90%)。 –

+0

謝謝加文,我用命令plot(tree,type =「simple」) –

+0

和is.factor()問題,返回值爲TRUE。 :) –

回答

0

這些都是後驗概率;即該節點的後驗概率對於類別1爲〜0.9(90%)(假設您的因子水平爲c(0, 1, 99),

在實際意義上,這意味着該節點中約90%的觀察值是1類,〜5%是0類,並沒有觀察的是99類的。

我覺得是拋出你的是,你的類是數字水平和劇情有後驗概率,也是數字。如果我們請看派對包的示例,其中響應是帶有字符級別的因素,希望您能理解繪圖和輸出從樹更好。

?ctree

library("party") 
irisct <- ctree(Species ~ ., data = iris) 
irisct 

R> irisct 

    Conditional inference tree with 4 terminal nodes 

Response: Species 
Inputs: Sepal.Length, Sepal.Width, Petal.Length, Petal.Width 
Number of observations: 150 

1) Petal.Length <= 1.9; criterion = 1, statistic = 140.264 
    2)* weights = 50 
1) Petal.Length > 1.9 
    3) Petal.Width <= 1.7; criterion = 1, statistic = 67.894 
    4) Petal.Length <= 4.8; criterion = 0.999, statistic = 13.865 
     5)* weights = 46 
    4) Petal.Length > 4.8 
     6)* weights = 8 
    3) Petal.Width > 1.7 
    7)* weights = 46 

這裏,Species是水平的因子變量

R> with(iris, levels(Species)) 
[1] "setosa"  "versicolor" "virginica" 

繪製的樹示出了在終端節點中的數字後驗概率:

plot(irisct, type = "simple") 

enter image description here

更翔實的情節雖然是:

plot(irisct) 

enter image description here

由於這清楚地表明,每個節點具有多個從一個或多個類的觀察。後驗概率是如何計算出來的。從樹

預測由predict()方法

predict(irisct) 

R> predict(irisct) 
    [1] setosa  setosa  setosa  setosa  setosa  setosa  
    [7] setosa  setosa  setosa  setosa  setosa  setosa  
[13] setosa  setosa  setosa  setosa  setosa  setosa 
.... 

您可以通過treeresponse功能objtain每個obsevration的posterioro概率給出

R> treeresponse(irisct)[145:150] 
[[1]] 
[1] 0.00000 0.02174 0.97826 

[[2]] 
[1] 0.00000 0.02174 0.97826 

[[3]] 
[1] 0.00000 0.02174 0.97826 

[[4]] 
[1] 0.00000 0.02174 0.97826 

[[5]] 
[1] 0.00000 0.02174 0.97826 

[[6]] 
[1] 0.00000 0.02174 0.97826 
+0

這太棒了,再次感謝Gavin! –

相關問題