2011-09-02 143 views
0

有誰知道我可以用來計算兩列列表中假陽性百分比的算法。R中的假陽性百分比

以我的情況爲例。我有一個聚類向量,顯示了一個聚類所屬的組,並且我在另一列上有正確的標籤。我知道一些分類是錯誤的,它們沒有映射到最常出現的標籤。我如何找到所有標籤的誤報百分比。我在R.

Cluster_vector | Labels 
     1    5  
     3    5 
     1    5 
     1    5 
     6    5 
+0

你可能想擴大你的觀點,包括得到一個混淆矩陣。 – Iterator

+0

你真的應該包括一個「假陽性」結果不是未定義的例子。如果沒有預測的「5」,你怎麼能計算一個FP在「5」?您還應該澄清哪些列代表「真相」或「黃金標準」。目前我無法確定。我會假設它是「R」編碼慣例中的「標籤」,但是您的文本讓我懷疑這是否是您看到它的方式。 –

+0

感謝標籤代表黃金標準,我自己也收集了它們。但是你知道R中的聚類矢量是如何得到的,因此你不能獲得與我的標籤相同的數字。 – damola

回答

1

實現這個你只是找錯配的比例,像mean(x[,1] != x[,2])

您可以通過table(x[,1] != x[,2])/nrow(x)得到混淆矩陣。