0

我使用ELKI's SimplifiedHierarchyExtractionAnderbergHierarchicalClustering,LatLngDistanceFunctionminClSize = 100ELKI等級聚類 - 「mrg_」羣集對象

我看到旁邊的"clu_" Clusters也有2-3 "mrg_" Clusters其中有一些DBID's,但它的數量是< minClSize

我的問題是:什麼是處理這種"mrg_" Clusters?的最佳方式:

  • 通過其DBID´s"clu_" children之一?
  • 把它們當作a cluster雖然它們是在minClSize之下嗎?
  • 乾脆忽略它們?

回答

1

這是一個分層的結果。

您需要將所有子集羣包括到集羣中。

所以mrg_集羣有一些(可能是0個)新對象,加上子集羣中的所有對象。特別是它可以有多個子集羣(這就是爲什麼它被稱爲合併

+0

所以你的意思是,如果我有一個'mrg_'其中包含4個'DBID's'並且有兩個孩子:'一個clu_和另外一個mrg_',那麼我應該考慮由'mrg_'的所有'clu_'孩子和他的'mrg_ child'組成的一個簇? – Paul

+0

是的。來自所有孩子的所有對象也屬於這個集羣。我們不存儲多餘的會員資格。 –

+0

但如果我這樣做,那麼我最終會得到少量的集羣。 – Paul