我正在R Studio中做一些數據的集羣。我對K-means聚類分析的結果以及繪製分層聚類的結果有問題。所以當我使用函數kmeans時,我得到了4組10,20,30和6個觀測值。儘管如此,當我繪製樹形圖時,我得到了4組,但觀察結果數量不同:23,26,10和7.使用k-means並繪製距離矩陣時結果的差異。爲什麼?
你有沒有發現過這樣的問題?
在這裏,你是我的代碼:
mydata<-scale(mydata0)
# K-Means Cluster Analysis
fit <- kmeans(mydata, 4) # 4 cluster solution
# get cluster means
aggregate(mydata,by=list(fit$cluster),FUN=mean)
# append cluster assignment
mydatafinal <- data.frame(mydata, fit$cluster)
fit$size
[1] 10 20 30 6
# Ward Hierarchical Clustering
d <- dist(mydata, method = "euclidean") # distance matrix
fit2 <- hclust(d, method="ward.D2")
plot(fit2,cex=0.4) # display dendogram
groups <- cutree(fit2, k=4) # cut tree into 4 clusters
# draw dendogram with red borders around the 4 clusters
rect.hclust(fit2, k=4, border="red")