2016-09-13 30 views
1

下午好,使用的graphviz出口

我對決策樹分類工作取得的特徵和類名成決策樹時遇到了問題形象化它。我可以輸出決策樹,但是我無法獲取我的特徵或類名/標籤。我的數據是熊貓數據幀格式,然後我轉入一個numpy數組並傳遞給分類器。我嘗試了一些東西,但是當我嘗試指定類名時,似乎在導出時出錯。任何幫助,將不勝感激。代碼如下。

all_inputs=df.ix[:,14:].values 
all_classes=df['wic'].values 

(training_inputs, 
testing_inputs, 
training_classes, 
testing_classes) = train_test_split(all_inputs, all_classes,train_size=0.75, random_state=1) 

decision_tree_classifier=DecisionTreeClassifier() 
decision_tree_classifier.fit(training_inputs,training_classes) 

export_graphviz(decision_tree_classifier, out_file="mytree.dot", 
        feature_names=??, 
        class_names=??) 

我說,它運行良好,並輸出一個決策樹,即如果我拿出feature_names和class_names參數。我想包括他們在輸出儘管如果可能,並已經打了一堵牆...

任何幫助將不勝感激!

感謝,

斯科特

回答

5

類名是存儲在decision_tree_classifier.classes_,即你的DecisionTreeClassifier實例的屬性classes_。功能名稱應該是輸入數據框的列。爲你的情況,你將有

classe_names = decision_tree_classifier.classes_ 
feature_names = df.columns[14:]