2016-08-03 65 views
-2

我用hclust來聚簇我的數據和cutree指定的羣集數爲3.有沒有什麼辦法可以檢查每個羣集?通過檢查,我的意思是列出例如在第一個集羣。我嘗試了所有我知道的基本功能,例如summary(),list() ...但似乎不相關。任何函數都可以這樣做?在R中的聚類

如果不是,cutree函數返回組/集羣的列表,每個我的觀察是屬於,是這樣的:

1,3,1,2,3,3,1

這表明我的第一次觀察屬於第1組,第二次屬於第三組... 我在考慮如何從列表中提取位置,例如group = 1,所以它會返回1,3和7,因爲觀察1,3,7屬於group 1

或者我需要使用一個循環來計算屬於例如該列表中的第1組?

我的問題清楚了嗎?

+0

有人幫忙嗎? – BigData

+0

不是你的問題不是很清楚,而是試圖回答。您可以使用cutree函數中的列表:1,3,1,2,3,3,1,您可以使用此數組對您的原始數據框進行子集或分組,以便檢查各個集羣。供參考:提供一個例子(數據和輸出在這個論壇獲得幫助很長的路要走。 – Dave2e

+0

我做到了,謝謝大家! – BigData

回答

0

這是一個提示,而不是答案。以下是Hierarchical Clustering in R的示例。您可以嘗試使用功能table(),ggplot()以查看每個羣集的觀察值。

0

這是否有助於開始?

nclust <- 10 

cutreeout <- cutree(hclustOutput, nclust) 

作爲新列添加到您的數據幀

mydata$cluster <- cutreeout 

有多少個觀察在每個集羣?

table(mydata$cluster) 

然後你可以做更多的事情來解釋你的集羣,和/或研究你的數據的子集。