2013-03-05 63 views
12

對不起,我是WEKA新手,剛剛學習。如何閱讀WEKA中的分類器混淆矩陣

在我的決策樹(J48)分類輸出,還有一個混淆矩陣:

a b <----- classified as 
130 8  a = functional 
15 150 b = non-functional 
  • 如何解讀這個矩陣? & b有什麼區別?
  • 另外,任何人都可以向我解釋什麼是域值?

回答

20

你看過wikipedia page on confusion matrices嗎?矩陣周圍的文本在它們的示例中的排列方式稍有不同(左側的行標籤而不是右側的行標籤),但是您也可以讀取它們。

該行指示真實的類,該列指示分類器輸出。然後,每個條目給出分類爲<column><row>的實例數。在您的示例中,15個B被(分類錯誤)歸類爲As,150個Bs被正確歸類爲Bs,等等。

因此,所有正確分類位於左上角至右下角的對角線上。對角線上的一切都是某種不正確的分類。

+0

我正確的是,WEKA中的CM是: 第1行:'TP | FP' 第2排:'FN | TN' – 2014-01-30 10:59:57

+0

@ user75782131:我不會那樣說的。如果有明確的正面和負面的課程,你的關於真正的積極等的聲明只適用於2類問題。許多分類問題不是這樣,但他們仍然存在混淆矩陣。 – Junuxx 2014-02-13 12:34:28

+0

對於2類問題,如果正類的索引爲0,則表示第一行爲TP,FN,第二行爲FP,TN。 – silmeth 2015-09-24 19:33:55

7

我會這樣說:

混淆矩陣是Weka的這個J48模式有多好是什麼它得到正確的方面報告,以及它得到錯誤的。

在您的數據中,目標變量是「功能性」或「非功能性」;矩陣的右側告訴你列「a」有效,「b」不起作用。

這些列告訴你你的模型是如何分類的樣本 - 它就是模型預測:

  • 第一列包含所有這些模型認爲是「一個」樣本 - 145人,總
  • 第二列包含所有這些模型認爲是「b」樣本 - 其中有158

該行,而另一方面,代表了現實:

  • 第一行包含所有的樣品,其確實是「一」 - 138其中,總
  • 第二行包含所有這確實是「b」的樣品 - 其中

165知道了列和行,你可以深入到細節:

  • 左上,130,有些事情你的模型自以爲是「一」,這真的是 「一」 < - 這是正確的
  • 左下,15 ,是的NGS模型認爲是「一」,但 真的是「B」 < - 一種錯誤的
  • 右上,8,有些事情你的模型認爲是「B」,但 真的是「一」 < - 另一一種錯誤
  • 右下,150件事情你的模型自以爲是「b」,這 真的是「b」

所以左上角和矩陣的右下角都顯示一些模型得到的權利。

矩陣的左下角和右上角顯示您的模型混淆的地方。