2015-05-09 29 views
0

我在學習文檔的準確性和回憶性,並且無法理解這個特定問題。檢索文檔的精確回憶值

下表顯示了由A和B表示的兩個排名爲 的檢索搜索引擎返回的前6個結果的相關性。'+'表示相關文檔,' - '表示不相關文檔。

enter image description here

假設有關文件的集合中的總數爲4,對於兩個發動機的頂部1,2,3,4,5和6的結果計算精確召回值。

搜索引擎A中給出的解決方案是:

精度: - 100% - | --50% - | --33.3% - | --25% - | --40 % - | --50% - |回調:------ 25% - | --25% - | --25%----- | --25% - | --50% - | --75% - |

對於B來說,溶液:

精度: - | 100% - | --100% - | --66.6% - | --50% - | --60% - | --50% - |回憶:---- | --- 25%--- | --50%---- | --50%----- | --50% - | --75% - | --75% - |

我知道如何計算單個文檔,並且Precsion = TP /(TP + FP)和Recall是TP /(TP + FN)。我只是不確定上面的一些值是如何計算的。

回答

1

這是太長的評論。

而不是試圖記住公式,試着理解這些概念。

「精確度」是:多少比例的結果是正確的?因此,對A和B而言,如果您取得最佳結果,則這是正確的。精度是100%。

「回憶」是:多少比例的正確結果存在?因此,對於A和B兩種情況,如果您取得最佳結果,則有四分之一的正確值,因此召回率爲25%。

+0

A的第二個結果是不相關的,我猜測精度值直到第四個分別被2,3和4除以回憶保持不變。第五和第六精度值是如何得到的?我瞭解他們的召回是如何解釋的。 – Gina

+0

我已經得到了如何計算第四和第五個值。 2/5,因爲它是第二個相關的和3/6,因爲它是第三個相關的。 – Gina

+0

@Gina。 。 。好。記住定義。這似乎是一個很好的例子。 –