1

我沒有在任何地方找到此問題的答案,所以我希望這裏有人能夠幫助我以及其他有同樣問題的人。針對不同羣體規模的精確度和召回計算

假設我有1000陽性標本1500陰性樣品

現在,假設有950真陽性(正確地分類爲陽性陽性樣品)和100個誤報(負樣本錯誤地歸類爲陽性)。

我是否應該使用這些原始數據來計算精度,還是應該考慮不同的組大小?

換言之,應該我的精度是:

TruePositive /(TruePositive +假陽性) = 950 /(950 + 100)= 90.476%

OR它應該是:

(TruePositive/1000)/ [(TruePositive/1000)+(假陽性/ 1500)] = 0.95/(0.95 + 0.067)= 93.44%

在第一次計算中,我沒有考慮每個組中樣本數量的原始數字,而在第二次計算中,我使用了每個度量的比例組,以消除由組的不同尺寸造成的偏差

回答

2

回答陳述的問題:通過definition,通過第一個公式計算精度:TP /(TP + FP)。

但是,這並不意味着你必須使用這個公式,即精確度量。還有很多其他的措施,看看this wiki page上的表格,然後選擇一個最適合你的任務。

例如,positive likelihood ratio似乎與您的第二個公式最相似。