通常,我們使用RMSE來評估模型的性能。我很好奇我們爲什麼使用平均殘差代替RMSE?爲什麼我們使用RMSE而不是平均殘差作爲模型的評估標準?
RMSE的定義:
這裏提到的平均殘留是:
例如:
我們有三個樣品:0 1 2
的這些樣品的預測值是:0 2 10
所以平均剩餘爲
的RMSE是
有啥這兩個值之間的差異?
通常,我們使用RMSE來評估模型的性能。我很好奇我們爲什麼使用平均殘差代替RMSE?爲什麼我們使用RMSE而不是平均殘差作爲模型的評估標準?
RMSE的定義:
這裏提到的平均殘留是:
例如:
我們有三個樣品:0 1 2
的這些樣品的預測值是:0 2 10
所以平均剩餘爲
的RMSE是
有啥這兩個值之間的差異?
(I將指RMSE和「平均殘餘」爲損失函數)
RMSE除了是一個凸函數外,還與高斯分佈很好地結合在一起,因爲RMSE與Normal有一個類似的表達式。
正態分佈很好地研究並自然發生在自然科學中發現的各種隨機過程中。將錯誤等同於正態分佈的擴展在許多情況下是有用的,例如,對數似然(https://www.statlect.com/fundamentals-of-statistics/normal-distribution-maximum-likelihood),對數後驗(http://www.utstat.toronto.edu/~rsalakhu/sta4273/notes/Lecture2.pdf看證據近似幻燈片)優化等。
是的,平均殘差應該使用絕對值。感謝您的回答,我明白了^ _ ^ –