我想在R.使用隨機森林包分類R無規森林變量重要性
列出的變量重要性措施是:
- 意味着變量x的原始重要性得分爲0類
- 平均原始重要性得分變量x的類1
MeanDecreaseAccuracy
MeanDecreaseGini
現在我知道這些「意思」是什麼,因爲我知道他們的定義。我想知道的是如何使用它們。
我真正想知道的是什麼,這些值只有他們是多麼準確,背景,什麼是一個很好的價值,什麼是不好的價值,什麼是最大值和最小值等
意思如果一個變量的值很高MeanDecreaseAccuracy
或MeanDecreaseGini
這是否意味着它是重要的還是不重要的?此外,關於原始分數的任何信息也可能有用。 我想知道關於這些與它們的應用有關的數字的一切。
使用「錯誤」,「求和」或「置換」這些詞的解釋不會有幫助,那麼簡單的解釋不會涉及隨機森林如何工作的任何討論。
就像我想讓某人向我解釋如何使用收音機一樣,我不會期望解釋涉及無線電如何將無線電波轉換爲聲音。
請包含指向實際用於節點拆分的Gini定義的鏈接:http://en.wikipedia.org/wiki/Decision_tree_learning#Gini_impurity – tashuhka 2014-06-10 13:36:44