在節點上,對於分類要素,我正在嘗試使用全部(2^m -2)/ 2種可能的方法將m個不同的要素值分爲兩組。具有相同特徵值的所有樣本在考慮該特徵時會作爲一組移動到一起。處理決策樹的分類特徵的策略?
問題是,當m爲35(例如國家)時,我將不得不嘗試17萬億次拆分。
處理分類特徵的任何替代方法?
在節點上,對於分類要素,我正在嘗試使用全部(2^m -2)/ 2種可能的方法將m個不同的要素值分爲兩組。具有相同特徵值的所有樣本在考慮該特徵時會作爲一組移動到一起。處理決策樹的分類特徵的策略?
問題是,當m爲35(例如國家)時,我將不得不嘗試17萬億次拆分。
處理分類特徵的任何替代方法?
如果這是一個二元分類問題,根據這一類別的平均響應命令m個值,然後嘗試m-1個的方式來分割該序列。
否則,鏈接只描述啓發式,包括Coppersmith,Hong和Hosking的啓發式。一個典型的例子是傻瓜化:只要嘗試m次分裂,每次分裂由右分支中的一個值和左分支中的m-1值組成。
搜索Don Coppersmith等人在「決策樹中分割名義屬性」 (是的,這是[Don Coppersmith](https://en.wikipedia.org/wiki/Don_Coppersmith)。:-) – blazs