我使用partykit:ctree來探索我的數據集,這是一組約15,000個海灘調查,調查從50不同的類別。數據中有很多零點,並且有大量的碎片總量。我還有一系列自變量,包括一些因素,一些計數數據和一些連續數據。在partykit中提取終端節點上的信息:ctree具有大量多變量響應
這裏是一個非常小的樣本數據集:
Counts<- as.data.frame(matrix (rpois(100,1), ncol=5))
colnames(Counts)<-c("Glass", "HardPlastic", "SoftPlastic", "PlasticBag", "Fragments")
State<-rep(c("CA","OR","WA"), each=6)
Counts$State<-c(State,"CA","OR")
County<-rep((1:9), each=2)
Counts$County<-c(County, 1,4)
Counts$Distance<-c(10, 15, 13, 19, 18, 23, 38, 40, 49, 44, 47, 45, 52, 53, 55, 59, 51, 53, 14, 33)
Year<-rep(c("2010","2011","2012"), times=7)
Counts$Year<-Year[1:20]
我用下面的代碼進行分區我的數據:
M.2<-ctree(Glass + HardPlastic + SoftPlastic + PlasticBag + Fragments ~
as.factor (State) + as.factor (County) + Distance + as.factor (Year), data=Counts)
plot(M.2, terminal_panel = node_barplot, cex = 0.5)
這來了一個可愛的圖形,但我怎麼解壓每個終端節點的成員資格?如果只有一些項目,我可以在圖表中看到它,但是一旦可能的類別數量增加到50個,以圖形方式查看它就變得更加困難。我希望看到節點中包含的信息;特別是每個終端節點中包含的每個單獨類別的相對概率。我知道如果這是一個BinaryTree類,我可以使用節點參數,但是當我查詢類(M.2)它告訴我它來自constaparty類,並且我還沒有能夠找到如何從這個類獲取節點信息。
我也遇到了第二個問題,那就是當我在我的示例數據集上運行ctree時,它每次都會使R崩潰!它對我的實際數據集正常工作,但我無法弄清楚樣本集有什麼問題。
編輯:期望的輸出將是沿着線的東西:
Node15:
硬塑料30個
玻璃5
軟塑膠23
塑料袋6
片段12
直到@Achim對此進行分類,你能顯示你想要的輸出嗎?多年來我寫了許多類似的功能,這些功能可以幫助我補充我在「party」包中丟失的東西。 –
Hi @David,我添加了一個基本可能的輸出...未格式化得非常漂亮,但是我想它會得到這個觀點嗎? – Alexandra