針對不同羣體規模的精確度和召回計算

我沒有在任何地方找到此問題的答案，所以我希望這裏有人能夠幫助我以及其他有同樣問題的人。針對不同羣體規模的精確度和召回計算

假設我有1000陽性標本和1500陰性樣品。

現在，假設有950真陽性（正確地分類爲陽性陽性樣品）和100個誤報（負樣本錯誤地歸類爲陽性）。

我是否應該使用這些原始數據來計算精度，還是應該考慮不同的組大小？

換言之，應該我的精度是：

TruePositive /（TruePositive +假陽性） = 950 /（950 + 100）= 90.476％

OR它應該是：

（TruePositive/1000）/ [（TruePositive/1000）+（假陽性/ 1500）] = 0.95/（0.95 + 0.067）= 93.44％

在第一次計算中，我沒有考慮每個組中樣本數量的原始數字，而在第二次計算中，我使用了每個度量的比例組，以消除由組的不同尺寸造成的偏差

回答陳述的問題：通過definition，通過第一個公式計算精度：TP /（TP + FP）。

但是，這並不意味着你必須使用這個公式，即精確度量。還有很多其他的措施，看看this wiki page上的表格，然後選擇一個最適合你的任務。

例如，positive likelihood ratio似乎與您的第二個公式最相似。

2015-12-19 22:41:57

回答