比方說,我有一些數據,數組的數組或數據幀,如:Refiguring K-均值聚類指標分析
In [4]: df
Out[4]:
a b c d
0 1 0 1 2
1 0 1 0 3
2 0 0 0 4
製作了一段K-意味着它集羣,像這樣:
centroids, _ = cluster.vq.kmeans(rep.values, nb_clusters, iter=100)
idx, _ = cluster.vq.vq(rep.values, centroids)
我得到了兩個對我有意義的集羣。但是,我想知道一種方法來了解K-means如何/爲何到達此羣集,例如。 哪個特徵a,b,c,d與分離簇最相關,等等。
有沒有人知道一種方法來做到這一點?或尋找一種方法來做到這一點?在蟒蛇,或更理論?
在此先感謝您考慮我的問題。