2016-12-06 60 views
0

我已經使用K均值算法與歐氏距離來聚類我的數據集,然後我嘗試了餘弦距離,但算法沒有收斂與餘弦度量 (它不停止 - 迭代達到1000)Kmean算法和餘弦距離

任何建議,請

回答

0

餘弦應該沒問題,因爲它相當於歐幾里得在L2標準化的數據。除非你有編程錯誤,否則應該收斂。

或者,您可以L2規範化您的數據,然後使用常規k-means而不是og球形k-means。

注意由設計小型批量不會收斂,以防您正在使用。如果你採樣批次,它不能。

+0

我沒有對數據應用L2規範嗎?使用PCA減少數據,將餘弦距離應用在Pc1,Pc2上 –

+0

不可以。不要應用餘弦和PCA。通常,當餘弦合適時,PCA是一個壞主意。 –