hclust

2熱度

1回答

我有一個具有近2000個樣本的hclust樹。我已經將它切成適當數量的簇，並想繪製樹狀圖但結束於我切割簇的高度，而不是一直到每個單獨的葉。每個繪圖指南都是關於通過簇繪製所有樹葉或繪製一個盒子，但似乎沒有將葉子完全留在切割線之下。我的全樹狀圖如下所示：我想繪製它，如果它停在那裏，我得出的abline這裏（例如）：

2熱度

1回答

hclust（）中的R對大數據集

我試圖實現中的R層次聚類：hclust（）;這需要由dist（）創建的距離矩陣，但我的數據集有大約一百萬行，甚至EC2實例耗盡RAM。有沒有解決方法？此

0熱度

1回答

獲取集羣層次結構和嵌套集羣分配

我目前正在關注文檔主題中的層次結構。作爲第一步，我找到了我的文檔的向量表示，然後使用分層聚類來確定文檔的主題內是否有主題。我只想考慮（嵌套的）至少包含2個原始數據的集羣。爲了達到這個目的，我使用R. 現在，我正在努力從聚類結果中有效地提取集羣層次結構。集羣使用「fastcluster」軟件包完成，它提供與原始「hclust」功能類似的結果。對於我的最終輸出應該看起來像這樣;將有兩個表集羣分配：

0熱度

1回答

基於標籤的重新排序和顏色樹狀圖

我想控制樹狀圖的順序和顏色。顯然，樹形圖的要點是通過相似性排序，但在分支內我想設置一個有意義的順序（字母數字）。 library(vegan) library(stats) x <-data.frame(data = c(1:10)) y = data.frame(type = c("A","B","C","A","C","D","A","B","C","B"), site_name =

1熱度

1回答

段（從分段）和類（從Hierchical Clustering）有什麼區別

我正在使用R進行meanshift分段！我現在感到困惑！我的第一個問題是如何將分割文件（將每個段定義爲超級像素）聚簇，然後我如何定義多少個對象以及我有多少個類！因爲當我做聚類時，有很多鄰居段在一個類中，所以我不能將它們計算爲多個段，而且它們是一個段？對？請別人幫忙！由於提前，

-1熱度

1回答

在hclust的簇周圍繪製多邊形

我通過使用函數hclust進行聚類，現在我想繪製每個簇周圍的多邊形！我該怎麼做？我只有一組具有集羣ID的點！例如這個圖像有兩個類和4個不同的區域！我如何獲得這些區域的數量？

0熱度

1回答

「樹」的「高度」組件未排序在cutree中的錯誤

我正在嘗試做一些分組並遇到此錯誤。 Evaluation error: the 'height' component of 'tree' is not sorted (increasingly). 我輸入的是： library(stringdist) name <- c("luke,abcdef","luke,abcdeh","luke,abcdeg") a<-stringdistmatrix

0熱度

1回答

dendextend：color_branches對某些hclust方法不起作用

我正在使用R dendextend包來繪製由hclust {stats}中的每個hclust方法生成的hclust樹對象：「ward.D」，「ward.D2」，「single」，「完整」，「平均」（= UPGMA），「mcquitty」（= WPGMA），「中位數」（= WPGMC）或「質心」（= UPGMC）。我注意到當我使用method =「median」或「centroid」時，colo

0熱度

1回答

使用hclust加權觀測頻率聚類R

我有一個500K觀測大型矩陣使用層次聚類進行聚類。由於尺寸較大，我沒有計算能力來計算距離矩陣。爲了克服這個問題，我選擇聚合我的矩陣，合併那些相同的觀測值，以便將我的矩陣約化爲10K個觀測值。我有這個聚合矩陣中每一行的頻率。我現在需要將這個頻率作爲分層聚類中的權重。該數據是500K觀測的數值和分類變量的混合，因此我使用雛菊包計算了我的聚合數據集的高爾異質性。我想在聚合數據集的統計數據包中使用hc

1熱度

1回答

ANOSIM與cutree分組

我想要做的是一些組合的數據定義分組的ANOSIM看分組是否彼此顯著不同，以類似的方式，以這個例子代碼： data(dune) data(dune.env) dune.dist <- vegdist(dune) attach(dune.env) dune.ano <- anosim(dune.dist, Management) summary(dune.ano) 然而，在我自己的數據中