-1
我們應該如何根據平均誤差指數或精度或召回進行羣集驗證? 我的疑問是,說使用數據集D,並遵循我的算法,我得到6個標記爲c1,c2,c3,c4,c5,c6的簇,每個簇中有50,60,30,40,10,10,10個元素分別 。通過與地面真相比較進行羣集驗證
在數據集D中,實際的聚類標籤分別爲1,2,3 ... 6,55,45,5,35,10,60個元素。
我的集羣標籤c1必須與實際集羣標籤1,c2到2,c3到3,...等對應嗎?
在這種情況下,我將如何計算平均錯誤指數?
我們如何驗證基於密度的聚類?哪種度量將是驗證密度聚類結果的最佳方法? – Bess
我不知道。我不認爲基於密度的驗證很有意義,因爲它只會報告基於密度的聚類提供了最佳的基於密度的聚類。真是一個驚喜。 驗證的最合理的方法是實際*使用*結果。在某種程度上看起來效果不錯,但在實踐中不起作用。 –
如果你有基礎事實,所有這些措施都可以用來*評估*密度聚類。這些措施不使用密度,但如果您有例如一個DBSCAN集羣和「真相」標籤,ARI是一種流行的措施。 –