1

我有一套多元(2D)高斯分佈(用均值和方差表示),並希望以保持概率高斯信息(可能使用方差重疊?)的方式對這些分佈執行聚類。有沒有辦法對一組多元高斯分佈進行聚類?

​​

我已經做了一些研究,聚類方法,發現DBSCAN聚類比K-手段比較合適,因爲我不知道有多少集羣期望找到。但是,DBSCAN利用歐幾里德距離epsilon值來查找集羣,而不是使用每個分佈的方差。我也研究過高斯混合模型方法,但它們將一組點擬合成一組K個高斯聚類,而不是將聚類擬合成一組高斯分佈。

有誰知道任何可能適合我需求的其他聚類方法嗎?

謝謝!

回答

1

DBSCAN可以使用任意距離。它是而不是限於歐幾里德距離。你可以使用分歧度量,例如你的高斯重疊多少

但是,我會建議分層聚類或高斯混合建模(EM)。

DBSCAN是設計允許香蕉形簇,這是不通過高斯很好地近似。你的目標似乎是合併類似的高斯人。這更好地通過分層聚類來實現。

+0

感謝您的迴應,我將深入研究使用層次聚類。 – Unl1ght

相關問題