爲了評估我的圖像檢索系統,我正在閱讀很多關於Precision-Recall曲線的內容。特別是,我正在閱讀關於VLFeat中的特徵提取器的文章this以及關於精確調用的wikipedia page。關於精度調用曲線和平均精度的困惑
我知道這條曲線對評估我們的系統性能w.r.t很有用。檢索的元素的數量。所以我們反覆計算檢索頂部元素的精度 - 回憶,然後回到頂部2,頂部3等...但我的問題是:什麼時候我們停止?
我的直覺是:當我們的檢索元素列表的回憶等於1時,我們停止,因此我們檢索所有相關元素(即沒有錯誤否定,只有真正的肯定)。
同樣的問題是平均精度:檢索結果中應該存在多少個元素來計算它?如果我以前的直覺是正確的,那麼我們只需要找出什麼是最小的列表s.t.召回是1,並用它來計算AP。
我不知道爲什麼所有用於計算p-r曲線的庫都沒有顯示這是如何實現的?
感謝您的詳細解答,這真的很有幫助。請閱讀[this](http://stackoverflow.com/questions/40906671/confusion-about-mean-average-precision)有關平均精度的相關問題 – justHelloWorld