2012-03-21 116 views
0

假設我已經使用例如k-means將包含1000個實例的5個類的訓練數據集聚類爲5個聚類(中心)。然後,我通過驗證測試數據集構造了一個混淆矩陣。然後我想用這個曲線繪製一條ROC曲線,怎麼可能做到這一點?分類或聚類結果的ROC曲線

回答

2

Roc曲線顯示真正正確率和假正面率之間的權衡。換句話說

ROC圖是在其中TP速率上 Y軸和FP速率繪出二維曲線當使用離散分類器繪製在X軸 ROC Graphs: Notes and Practical Considerations for Researchers

,這個分類器在ROC空間中只產生一個點。通常你需要一個產生概率的分類器。您可以在分類器中更改參數,以便您的TP和FP的費率發生變化。之後,您使用這些點繪製ROC曲線。

可以說你使用k-means。 K-means是分散給你的集羣成員資格。一個點屬於ClusterA或ClusterE。因此,從k-means輸出ROC曲線並不簡單。 Lee and Fujita 描述了一個算法。你應該看看他們的論文。但算法是這樣的。

  1. 應用k均值使用測試數據
  2. 計算TP和FP。
  3. 更改從一個羣集到第二個羣集的數據點的成員資格。
  4. 再次使用測試數據計算TP和FP。

正如你看到他們得到ROC空間更多的積分,並使用這些點來繪製ROC曲線

+0

你是如何「數據點的變化會員從一個羣集到第二集羣」?你隨機選擇一個數據點,並將其分配給一個隨機簇,或者你怎麼做? – shn 2012-03-23 03:47:00

+0

根據論文,他們選擇一個點,當其集羣成員轉移時,k-平均總體目標函數不會發生太大的變化。 – 2012-03-23 06:46:04