我正在嘗試使用kmeans進行分析。r - 在kmeans圖中繪製離羣點
我有一個數據集:
> head(data)
tstamp elementid value hours
2016-09-15 15:20:28 IN_TEMP 25.12237 15
2016-09-15 15:20:29 IN_TEMP 25.44952 15
2016-09-15 15:20:29 IN_TEMP 25.53550 15
2016-09-15 15:20:39 IN_PRESSURE 101.40683 15
2016-09-15 15:20:49 IN_TEMP 25.94596 15
2016-09-15 15:20:49 IN_TEMP 25.38742 15
所以我做了這個:
dataCluster <- kmeans(data[, 3:4], 2, nstart = 20)
dataCluster$cluster <- as.factor(dataCluster$cluster)
levels(dataCluster$cluster) <- c("IN_TEMP", "IN_PRESSURE")
ggplot(data, aes(value, hours, color = dataCluster$cluster)) + geom_point()
它是確定我,但是當我做:
table(dataCluster$cluster, data$elementid)
IN_PRESSURE | IN_TEMP
IN_TEMP | 0 | 953
IN_PRESSURE | 508 | 44
我在第二個羣集上有44個值是IN_TEMP值(第一個羣集)。
我可以使用第一簇的顏色(紅色)來繪製這44個值嗎?
感謝您的幫助 問候
分析中kmeans聚類的意義何在? –
我有兩種數據(溫度和壓力)。它顯然是我會創建2個羣集,但我做了這個向我的老闆展示這個算法的想法:) – VDFerreira