2017-05-24 87 views
0

我使用scikit學習的梯度升壓樹木分類,GradientBoostingClassifier。它使得功能重要性得分可用feature_importances_。如何計算這些要素重要性?功能重要性如何計算GradientBoostingClassifier

我想了解什麼算法使用,以幫助我瞭解如何解釋這些數字scikit學習。該算法未在文檔中列出。

+0

它記錄在這裏:http://scikit-learn.org/stable/modules/ensemble.html#feature-importance-evaluation – EdChum

+0

謝謝,@EdChum!原來,這是不太正確的鏈接(你給的鏈接是RandomForests和ExtraTrees的文檔),但它幫助我找到GradientBoostingClassifier答案。我寫了一個解釋的答案。謝謝你的幫助! –

回答

1

這個scikit學習文檔中記載elsewhere。特別是,在這裏是如何工作的:

對於每個樹,我們計算一個特徵F作爲樣本,將遍歷分裂基於特徵F節點(見here)的部分的功能重要性。然後,我們平均在所有的樹木(如描述here)這些數字。

它沒有描述究竟如何scikit學習的估計,將遍歷上的功能分割F.

的解釋樹節點節點的分數:分數將在範圍[0,1]。分數越高意味着該功能更重要。不要指望得分總和爲1;他們沒有這樣規範化。