2017-08-03 44 views
0

使用sklearn.tree.export_graphiz()時,導出的樹節點標籤包含統計元數據,如samplesvalue在沒有統計元數據的情況下呈現scikit-learn DecisionTreeClassifier?

我想在沒有此數據的情況下向用戶顯示樹的版本。也就是說,只有決策標準如length <= 7和分類本身將顯示在節點內部,沒有別的。

這可能與export_graphviz()?我看到的只是一個刪除impurity得分的關鍵字選項,但沒有其他統計信息。

+0

翻遍源代碼,似乎沒有排除這些其他統計信息的配置路徑。我可能需要通過解析DOT文件數據並修改節點標籤以適應我的要求來後處理DOT文件數據。 –

+0

好吧,有一個參數'label',當設置爲'None'時會隱藏信息標籤以防止雜質,等等所有節點。也許這可以幫助。 –

+1

@VivekKumar:是的,謝謝,該參數存在。不幸的是,它並沒有從樹節點中刪除所有的統計元數據,只有數據的*標籤*,所以對我來說還不夠好。 –

回答

0

代碼中目前沒有這樣的選項。我必須獲取DOT文件內容的字符串(通過提供out_file=None參數),然後通過簡單的DOT解析器處理它以從標籤中刪除所有元數據。

相關問題