任何人都可以幫助我統計計算F-measure嗎?我知道如何計算召回和精度,但不知道給定的算法如何計算一個F-measure值。計算聚類的F-measure
作爲爲例,假設我的算法創建米集羣,但我知道有ñ集羣爲相同的數據(如由另一基準算法創建)。
我找到了一個pdf,但沒有用,因爲我得到的集合值大於1. pdf的參考是F Measure explained。具體來說,我已經閱讀了一些研究論文,其中筆者根據F-measure對兩種算法進行了比較,他們將0到1之間的值集中在一起。 如果仔細閱讀上面提到的pdf,公式爲F(C,K )=Σ| ci |/N * max {F(ci,kj)}
其中ci是參考簇& kj是由其他算法創建的簇,在這裏我從1運行到n & j從1運行到m.Let say | c1 | = 218這裏按照pdf N = m * n假設m = 12和n = 10,並且對於j = 2我們得到了最大F(c1,kj)。當然,F(c1,k2)介於0和1之間,但通過上述公式計算的結果值我們將得到高於1的值。
你可以發佈你的召回和精度? IINM如果他們介於0和1之間,他們的平均值(請參閱您的參考)應該<1(請檢查您的公式)。如果他們不是,你的算法很可能是錯誤的。 –
是的,請詳細說明您如何獲得精確度和召回率。他們必須在0到1纔有意義。否則,F1也會走出界限。你可能有*重疊*集羣?然後它不會工作;而且我不知道確實允許評估重疊羣集的擴展。 –
我認爲這是指:http://nlp.stanford.edu/IR-book/html/htmledition/evaluation-of-clustering-1.html –