2012-12-14 44 views
0

我試圖想象如何將決策樹應用於測試集,並且我正在使用Weka的J48決策樹。 Weka通過評估決策樹併到達葉子來識別每個樣本。當然,多個葉子被標記爲相同的類別。是否有人知道如何讓Weka告訴每個樣本使用哪個葉子標記樣本?輸出選擇的決策樹葉

X < 47 
| Y > 10 : Class1 (...) 
| Y <= 10 : Class2 (...) 
X >= 47 
| Y > 15 : Class1 (...) 
| Y <= 15 
| | Z > 10 : Class2 (...) 
| | Z <= 10 : Class1 (...) 

我想的東西,會說: 「樣品15被分類爲1類,因爲(X> = 47,Y = < 15,Z < = 10)」 或類似的東西。

或者,我想要說「27個樣品被歸類爲Class1,因爲(X> = 47,Y < = 15,Z < = 10)」。

改變 - 或者,是否有人知道有人將此信息可視化的實例,或者是否有其他軟件將此信息吐出?謝謝。

回答

0

如果有人知道一個,我仍然想要一個真實的答案,但我的答案是Weka不包含這種能力。我的解決方案是製作一件我需要的東西。它可在這裏:

GitHub:DecisionTreeDNA

我不會用它做呢。它會用數字來構建一個很酷的圖表,但它已經吐出了我想要的數字。噢 - 它所吐出的數字是「27個樣品被歸類爲1類,因爲(X> = 47,Y = < = 15,Z = < = 10)」多樣,但很容易修改爲吐出「樣品15被分類作爲Class1,因爲(X> = 47,Y = < = 15,Z = < = 10)「。