1

我使用weka的評估類作爲隨機森林中每個生成樹的平均絕對誤差。解釋說:「指的是數值類的預測值的誤差,以及名義類的預測概率分佈的誤差。」Random Forest中每棵樹的平均絕對誤差

有人可以用簡單的詞語或可能用一個例子來解釋嗎?

回答

1

平均絕對誤差表示您的預測平均與測試數據的實際值有多接近。

對於數字類,這很容易思考。
實施例:

真值:{0,1,4}
預測值:{1,3,1}
差異:{-1,-2,3}(減去真實預測)
絕對差:{1,2,3}
平均絕對差:(1 + 2 + 3)/ 3 = 2

對於標稱類的預測是不再是單一的值,而是屬於不同p的實例的概率分佈可能的課程。提供的示例將有兩個類。
實施例:

記號:[0.5,0.5]表示與屬於類Y,屬於類X.

真分佈的50%的機會爲50%的機會的實例:{[0, 1],[1,0]}
預測分佈:{[0.25,0.75],[1,0]}
差異:{[-0.25,0.25],[0,0]}
絕對差: {(0.25 + 0.25)/ 2,(0 + 0)/ 2} = {0.25,0}
平均絕對差值:(0.25 + 0)/ 2 = 0.125

You can double check my explanation by visiting the source code for Weka's evaluation class.
另外,作爲一個側面說明,我相信Weka的隨機森林報道的平均絕對差是森林作爲一個整體,而不是個別樹木。

+0

你能否解釋Weka如何計算名義類的預測分佈? – AlexSee