2014-06-13 39 views
0

難道有人能給我舉一個例子,說明每個人是如何工作的,以及他們的錯誤措施如何不同?謝謝!使用RMSE和nDCG評估推薦系統的區別?

+0

我會建議此舉遷移到http://datascience.stackexchange.com/,您可能會提出更具體的問題。你可以在互聯網上找到兩個例子。 –

回答

0

標準化折扣累積收益(NDCG)根據推薦實體的分級相關性度量推薦系統的性能。它從0.0到1.0變化,1.0代表實體的理想排名。該度量標準通常用於信息檢索和評估網絡搜索引擎的性能。

均方根誤差(RMSE)可能是在評估預測評級準確性時使用的最受歡迎的度量標準 。系統生成預測評級 Rui對於已知其實際評級Rui的用戶項目對(u,i)的測試集合T。 通常,Rui是已知的,因爲它們隱藏在離線實驗中,或者因爲它們是通過用戶研究或在線實驗獲得的。它從0.0到1.0變化,較低的值表示較少的錯誤(因此「更好」)。

您很可能會看到學術論文包含RMSE,雖然NDCG確實有它的位置,但您並不經常看到NDCG,尤其是當您使用強大的信息檢索組件檢查推薦系統時。均方根誤差並非特定於應用程序,因此在評估推薦系統的預測準確度時,大多數學術文獻都傾向於將其納入其中。

此信息是容易通過谷歌訪問,所以請在未來花一些時間做一些研究,然後再發布這樣的問題。有大量的工作示例,公式詳細清楚地顯示在每個維基頁NDCG:http://en.wikipedia.org/wiki/Discounted_cumulative_gain#Normalized_DCG和RMSE:http://en.wikipedia.org/wiki/Root-mean-square_deviation