2011-11-23 59 views

回答

1

您可以定義一個函數,根據屬性權重來計算兩點之間的距離。例如,這將是加權歐幾里德距離

具體而言,如果數據集中每個點有k個屬性,並且屬性的相應權重爲d1,d2,..,dk,則兩個點X和Y之間的距離是

d(X,Y)=總和(二*(XI-易)^ 2)I = 1,2..k其中X是第i個屬性的值的點X.

如果權重是屬性方差的倒數,它降低到馬氏距離

http://en.wikipedia.org/wiki/Mahalanobis_distance

定義距離函數後,可以使用K-means對數據進行聚類。