3

在R中的pvclust包中,有pvclust()函數。在功能幫助文件中提供的示例中,有以下功能:有人可以解釋R中pvclust函數的輸出嗎?

boston.pp <- pvpick(boston.pv) 

這應該打印出具有高p值的羣集。這個函數的輸出是:

$clusters 
$clusters[[1]] 
[1] "rm" "medv" 

$clusters[[2]] 
[1] "zn" "dis" 

$clusters[[3]] 
[1] "crim" "indus" "nox"  "age"  "rad"  "tax"  "ptratio" "lstat" 


$edges 
[1] 3 5 9 

我很難理解輸出的含義,尤其是因爲我對聚類分析的技術背景非常有限。特別是,我不明白每個羣集下的名稱向量的含義。有人可以爲我解釋嗎?謝謝!

回答

0

https://cran.r-project.org/web/packages/pvclust/pvclust.pdf 描述pvclust:

對於表示爲數據爲(N×P)矩陣或數據幀,我們假定數據爲p對象,將被集羣的N個觀測。的第i行矢量對應於這些對象的第i個觀察和第j列向量對應於第j個對象物的樣品與大小爲n

輸出pvpick的:

cluster - 字符串向量列表。每個矢量對應於每個羣集中對象的名稱。

您是否繪製了pvclust輸出的樹狀圖? pvpick clusters輸出只列出了內部點(pvclust將波士頓數據集中的每個作爲一個點),在某些聚類中,如果繪製它,您將在樹狀圖中看到它。 enter image description here

+0

確實是pvclust集羣變量和hclust集羣觀察? – xyy

+0

@xyy,是的,你可以嘗試boston.hc < - hclust(dist(波士頓))確定這一點。 –

相關問題