的情況如下:使用一對計數F值評估層次聚類
我有我已經手動分配給基於其受試者的(地面)羣集文件的數據集。然後我使用Hierarchical Agglomerative Clustering(HAC)來自動聚集相同的數據集。我現在試圖使用計數f-measure對來評估HAC集羣(如Darius Pfitzner,Richard Leibbrandt & David Powers的表徵和相似性測量評估 中所述。
然而,我面臨的問題是,我的手動聚類生成了平面聚類(因此聚類之間沒有關係),而HAC發現的聚類是分層的。因此,在查看樹狀圖時,根據您選擇的深度(水平線),您擁有不同數量的聚類(在深度0(根節點)處,您只有1個聚類;在MAX深度處,聚類數等於數您的數據集中的元素)。
所以,我的問題現在是:
- 我需要爲了使用一對計數F值來選擇深度(讓我有一組固定的集羣)(還是我失去了什麼東西?)。
- 如果是這樣,我用什麼標準來確定這個深度?
謝謝你的回答。我會看看! – Niels