R中的假陽性百分比

有誰知道我可以用來計算兩列列表中假陽性百分比的算法。R中的假陽性百分比

以我的情況爲例。我有一個聚類向量，顯示了一個聚類所屬的組，並且我在另一列上有正確的標籤。我知道一些分類是錯誤的，它們沒有映射到最常出現的標籤。我如何找到所有標籤的誤報百分比。我在R.

Cluster_vector | Labels 
     1    5  
     3    5 
     1    5 
     1    5 
     6    5

2011-09-02 damola

你可能想擴大你的觀點，包括得到一個混淆矩陣。 – Iterator

你真的應該包括一個「假陽性」結果不是未定義的例子。如果沒有預測的「5」，你怎麼能計算一個FP在「5」？您還應該澄清哪些列代表「真相」或「黃金標準」。目前我無法確定。我會假設它是「R」編碼慣例中的「標籤」，但是您的文本讓我懷疑這是否是您看到它的方式。 –

感謝標籤代表黃金標準，我自己也收集了它們。但是你知道R中的聚類矢量是如何得到的，因此你不能獲得與我的標籤相同的數字。 – damola

實現這個你只是找錯配的比例，像mean(x[,1] != x[,2])？

您可以通過table(x[,1] != x[,2])/nrow(x)得到混淆矩陣。

2011-09-02 23:33:15 Karl

回答