0
我使用ELKI's SimplifiedHierarchyExtraction
與AnderbergHierarchicalClustering
,LatLngDistanceFunction
和minClSize = 100
。ELKI等級聚類 - 「mrg_」羣集對象
我看到旁邊的"clu_" Clusters
也有2-3 "mrg_" Clusters
其中有一些DBID's
,但它的數量是< minClSize
。
我的問題是:什麼是處理這種"mrg_" Clusters?
的最佳方式:
- 通過其
DBID´s
其"clu_" children
之一? - 把它們當作
a cluster
雖然它們是在minClSize
之下嗎? - 乾脆忽略它們?
所以你的意思是,如果我有一個'mrg_'其中包含4個'DBID's'並且有兩個孩子:'一個clu_和另外一個mrg_',那麼我應該考慮由'mrg_'的所有'clu_'孩子和他的'mrg_ child'組成的一個簇? – Paul
是的。來自所有孩子的所有對象也屬於這個集羣。我們不存儲多餘的會員資格。 –
但如果我這樣做,那麼我最終會得到少量的集羣。 – Paul