2010-05-30 186 views
2

我想了解貝葉斯網絡。我有一個數據文件,它有10個屬性,我想要獲取這個數據表的混淆表,我想我需要計算所有字段的tp,fp,fn,tn。這是真的嗎?如果這是我需要做的貝葉斯網絡。貝葉斯網絡的混淆矩陣

真的需要一些指導,我迷路了。

+0

我對理解這個問題有困難。你的貝葉斯網絡執行什麼任務?它是分類嗎?如果是這樣,什麼是分類,它是你的數據文件中的屬性之一?更多的信息會使這個問題更容易回答。 – 2010-06-02 16:29:29

回答

4

的過程通常是這樣的:

  • 你必須要使用到訓練 分類,以便它可以預測 類新的無標籤實例的一些標記數據實例 。
  • 使用您的分類器 的選擇(神經網絡,bayes 網,SVM等),我們建立一個 模型與您的訓練數據 作爲輸入。
  • 在這一點上,你通常想 部署之前評估 模型的性能。因此,使用數據 (試驗組)的 以前未使用的子集,我們比較模型 分類爲這些情況 針對實際的類。總結這些結果 甲 好方法是通過一個混淆矩陣表示 每個類的實例是如何 預測。

對於二元分類任務,慣例是將一個類分配爲正數,另一個爲負數。因此,從混淆矩陣中,被正確分類爲正的正實例的百分比被稱爲真正(TP)速率。其他定義遵循相同的約定......

0

你所問的是一個混淆矩陣有兩個以上的班。 這裏是你怎麼做的步驟:

  • 建立一個分類爲每個類,其中的訓練集由 集合類中的文件(正標籤)及其 補(負標籤)。
  • 給出測試文檔,分別應用每個分類器。
  • 文件分配給具有最大比分, 最大置信度值或最大概率

這裏類是可以有更多的信息紙參考:

Picca, Davide, Benoît Curdy, and François Bavaud.2006.Non-linear correspondence analysis in text retrieval: A kernel view. In Proc. JADT.