我想讀的IRStatisticsImpl
數據,但有一些問題:如何解釋象夫IRStatisticsImpl數據
我的結果是:
IRStatisticsImpl[precision:0.04285714285714287,recall:0.04275534441805227,fallOut:0.0018668022652391654,nDCG:0.04447353132522083,reach:0.997624703087886]
沒有意思,我只拿到4%的好建議(精確)和大約相同水平的不良推薦(召回)?
最好的數字應該是什麼樣子 - 精度爲1.0,回憶爲0.0?
你能告訴我,'fallOut'和'nDCG'的數字應該如何?它們應該是1.0還是0.0? – ulkas 2013-05-20 07:35:42
顧名思義,fallOut是「從所有可用的非相關文檔中檢索到的非相關文檔的比例:」http://en.wikipedia.org/wiki/Information_retrieval#Fall-out據我所知,它應該儘可能低,但它也很容易得到0%,所以你可能會評估你的域名。 – gpicchiarelli 2013-05-20 08:32:34
關於nDCG,它是DCG的標準化版本,意思是「折扣累積收益」。確切地說,在這裏看看http://en.wikipedia.org/wiki/Discounted_cumulative_gain – gpicchiarelli 2013-05-20 08:42:15