我沒有在任何地方找到此問題的答案,所以我希望這裏有人能夠幫助我以及其他有同樣問題的人。針對不同羣體規模的精確度和召回計算
假設我有1000陽性標本和1500陰性樣品。
現在,假設有950真陽性(正確地分類爲陽性陽性樣品)和100個誤報(負樣本錯誤地歸類爲陽性)。
我是否應該使用這些原始數據來計算精度,還是應該考慮不同的組大小?
換言之,應該我的精度是:
TruePositive /(TruePositive +假陽性) = 950 /(950 + 100)= 90.476%
OR它應該是:
(TruePositive/1000)/ [(TruePositive/1000)+(假陽性/ 1500)] = 0.95/(0.95 + 0.067)= 93.44%
在第一次計算中,我沒有考慮每個組中樣本數量的原始數字,而在第二次計算中,我使用了每個度量的比例組,以消除由組的不同尺寸造成的偏差