1

假設有三列[「A」,「B」,「C」],我們可以指定拆分的順序,以便首先拆分「A」類別,然後是「B」,然後由其他類別拆分?是否可以通過scikit-learn指定在決策樹中分割的順序?

根據DecisionTreeClassifier上的文檔頁面,沒有這樣的選項。有什麼辦法解決它?

http://scikit-learn.org/stable/modules/generated/sklearn.tree.DecisionTreeClassifier.html

+0

這是不可能的。樹會自動選擇在每個節點上減少基尼/熵標準的特徵。 –

回答

0

這是不可能做到這一點。樹會自動選擇特徵,方法是分析每個特徵的差異並選擇最有利的分割。

此外,如果您自己選擇拆分,那麼您的模型不會有效地執行。

+0

關於「高效」,它取決於數據。如果這些功能之間存在某種依賴關係,那麼指定特定的順序可能會有所幫助。 – Girishkumar

+0

@Girishkumar,不,它不依賴於數據。你是否明白算法的全部重點是找到最大化分裂效率的分裂?在機器學習中,基於啓發式的確定性規則的應用導致比基於統計的規則更糟的結果。這就是ML開拓者稱之爲統計學習的原因。 – AN6U5

相關問題