用K確定K值的Scree圖

2015-11-17 79 views -1 likes

-1

我正在學習R，在做K均值聚類的同時，我多次發現了下面的函數，以便從scree圖確定最佳K值。現在，我明白了這個函數背後的邏輯，但是我很難理解R函數，有人可以解釋一下。用K確定K值的Scree圖

wssplot <- function(data, nc=15, seed=1234) 
    { 
    wss <- (nrow(data)-1)*sum(apply(data,2,var)) 
    for (i in 2:nc) 
    { 
     set.seed(seed) 
     wss[i] <- sum(kmeans(data, centers=i)$withinss) 
    } 
    plot(1:nc, wss, type="b", xlab="Number of Clusters", 
    ylab="Within groups sum of squares") 
}

來源

2015-11-17 Ranjan Pandey

你不明白？ –

要避免編輯標題：[scree plot]（http://support.minitab.com/en-us/minitab/17/topic-library/modeling-statistics/multivariate/principal-components-and-factor-analysis/what-is-scree-plot /） –

我不明白'wss < - （nrow（data）-1）* sum（apply（data，2，var））'的需要和作用。 –

回答

該函數運行kmeansnc-1倍，並發現平方和，它概括了的矢量。這是每個迭代的結果，它們依次繪製在一個圖上，其中x軸表示聚類數量，y軸表示平方和的總和。

來源

2015-11-17 09:55:20

感謝@羅曼，所以我所理解的是它在wss中創建了一個'在平方和之內'的矢量，然後將它與2到15的羣集數進行比較。我不明白'wss < - （nrow（data）-1）* sum（apply（data，2，var））'。我從函數中刪除它，仍然得到相同的情節。 –

'wss'是長度爲1的矢量，並被循環覆蓋（並拉長）。這可能是來自函數以前版本的基本變量，或者是在函數寫入過程中一直存在的內容。或者是初始化循環寫入所需的對象的一種非常麻煩的方式。您可以用'wss < - rep（NA，length（2：nc））'替換它。 –

謝謝！這正是我的想法 –

相關問題

11. 動態K值
12. k的可能值
13. number xor K - K = number + K xor K，爲什麼？
14. 用`-k`和不用`-k`捲曲
15. 具有k值的K均值聚類自動生成
16. K均值指標
17. K均值聚類
18. K均值分類
19. OpenCV的運行K均值圖像
20. 的ArrayList與地圖<K,V>值
21. 通用T GetByID <K>（K ID_）
22. K-尺寸子圖
23. 使用K-MVC重定向
24. [R k均值（統計數據）與K均值（AMAP）
25. 張量的最小K值？
26. 確定M的值，M是否取決於k？
27. k均值算法中k和質心之間的差異
28. OpenCV的k均值：N> = K例外，錯誤（-215）
29. 獲取k值的所有排列（k = 1 ... n）
30. OpenCV中不知道「k」的分層k均值