2012-02-23 137 views
3

我使用C++和做過k均值聚類的OpenCV有12點的中心(每個在200種尺寸)。馬哈拉諾比斯距離VS歐幾里德距離在矢量量化

現在,我在200點的尺寸一套點,我試圖找到最接近集羣矢量量化)。

哪個距離優於其他距離(馬氏距離或歐幾里得距離)?目前我使用歐幾里德距離。

+2

您可能正在編寫程序,但您的問題與編程無關。它涉及領域特定的知識。 – 2012-02-24 04:17:20

回答

4

Andrey's point是有效的。我可以添加一個通用語句:

對於Mahalanobis距離,您需要能夠正確估計每個羣集的協方差矩陣。對於200個維度,您可以期望對協方差矩陣羣進行合理估計的唯一方法是使用幾百到幾千個數據點。再加上你擁有的12個簇,你很容易需要數以萬計的數據點來合理使用Mahalanobis距離。

除此之外:請嘗試歐幾里德距離如何爲您工作。如果結果合理,只需堅持,否則嘗試馬哈拉諾比斯。

最後,您可能會在stats stackexchange上發現更多關於此主題的知識淵博的人。

4

如果不知道上下文,這是不可能回答的。沒有好的或壞的指標,每一個都更適合於一類特定的問題。