2017-03-22 16 views
0

當我使用count:poisson而不是rmse時,我看到的值爲nloglikelihood。現在我不確定如何將這些數字與rmse或mae進行比較。xgboost poisson run中的nloglikelihood值後面的直覺

肯定會更好的價值..但沒有得到實際的錯誤直覺,我們與rmse或湄獲得。

例如 - >train-poisson-nloglik:2.01885 val-poisson-nloglik:2.02898

在這裏,我們可以說,實際值由2.02錯誤不同。 有人可以用小例子來解釋。 謝謝。

回答

0

上有值的計算好的帖子here

只是要更詳盡,值是:

mean(factorial(label) + preds - label*log(preds)) 

如果用負對數似然的真奶粉比較,它應該是sum而不是mean。我想他們選擇平均值,以便列車和測試值更具可比性。

最後,要回答這個問題,可能性是數據來自具有特定參數的分佈的概率。在泊松模型中,參數只是一組預測值。所以你的預測越好,概率越大,相關的負對數似然值越小。

rmsemae基於預測與真值之間的差異的預期,而負對數似然性正在查看概率。