2016-08-12 59 views

回答

0

許多人使用一個熱碼這一點。

結果通常比較差,因爲k-means是爲連續變量設計的。得到的聚類中心將不再是二進制,並且可以不映射回範疇值,以及(這並不奇怪,因爲K-手段是所有關於意味着,但什麼是「蘋果」,「香蕉」的平均值和「橙」)?

如果您改爲查找頻繁項目集而非k均值中心,通常您會得到更有意義的結果。

相關問題