hclust

    2熱度

    1回答

    我有一個具有近2000個樣本的hclust樹。我已經將它切成適當數量的簇,並想繪製樹狀圖但結束於我切割簇的高度,而不是一直到每個單獨的葉。每個繪圖指南都是關於通過簇繪製所有樹葉或繪製一個盒子,但似乎沒有將葉子完全留在切割線之下。 我的全樹狀圖如下所示: 我想繪製它,如果它停在那裏,我得出的abline這裏(例如):

    2熱度

    1回答

    我試圖實現中的R層次聚類:hclust();這需要由dist()創建的距離矩陣,但我的數據集有大約一百萬行,甚至EC2實例耗盡RAM。有沒有解決方法?此

    0熱度

    1回答

    我目前正在關注文檔主題中的層次結構。作爲第一步,我找到了我的文檔的向量表示,然後使用分層聚類來確定文檔的主題內是否有主題。我只想考慮(嵌套的)至少包含2個原始數據的集羣。爲了達到這個目的,我使用R. 現在,我正在努力從聚類結果中有效地提取集羣層次結構。集羣使用「fastcluster」軟件包完成,它提供與原始「hclust」功能類似的結果。 對於我的最終輸出應該看起來像這樣;將有兩個表 集羣分配:

    0熱度

    1回答

    我想控制樹狀圖的順序和顏色。顯然,樹形圖的要點是通過相似性排序,但在分支內我想設置一個有意義的順序(字母數字)。 library(vegan) library(stats) x <-data.frame(data = c(1:10)) y = data.frame(type = c("A","B","C","A","C","D","A","B","C","B"), site_name =

    1熱度

    1回答

    我正在使用R進行meanshift分段!我現在感到困惑!我的第一個問題是如何將分割文件(將每個段定義爲超級像素)聚簇,然後我如何定義多少個對象以及我有多少個類!因爲當我做聚類時,有很多鄰居段在一個類中,所以我不能將它們計算爲多個段,而且它們是一個段?對?請別人幫忙! 由於提前,

    -1熱度

    1回答

    我通過使用函數hclust進行聚類,現在我想繪製每個簇周圍的多邊形! 我該怎麼做?我只有一組具有集羣ID的點! 例如這個圖像有兩個類和4個不同的區域!我如何獲得這些區域的數量?

    0熱度

    1回答

    我正在嘗試做一些分組並遇到此錯誤。 Evaluation error: the 'height' component of 'tree' is not sorted (increasingly). 我輸入的是: library(stringdist) name <- c("luke,abcdef","luke,abcdeh","luke,abcdeg") a<-stringdistmatrix

    0熱度

    1回答

    我正在使用R dendextend包來繪製由hclust {stats}中的每個hclust方法生成的hclust樹對象:「ward.D」,「ward.D2」,「single」, 「完整」,「平均」(= UPGMA),「mcquitty」(= WPGMA),「中位數」(= WPGMC)或「質心」(= UPGMC)。 我注意到當我使用method =「median」或「centroid」時,colo

    0熱度

    1回答

    我有一個500K觀測大型矩陣使用層次聚類進行聚類。由於尺寸較大,我沒有計算能力來計算距離矩陣。 爲了克服這個問題,我選擇聚合我的矩陣,合併那些相同的觀測值,以便將我的矩陣約化爲10K個觀測值。我有這個聚合矩陣中每一行的頻率。我現在需要將這個頻率作爲分層聚類中的權重。 該數據是500K觀測的數值和分類變量的混合,因此我使用雛菊包計算了我的聚合數據集的高爾異質性。我想在聚合數據集的統計數據包中使用hc

    1熱度

    1回答

    我想要做的是一些組合的數據定義分組的ANOSIM看分組是否彼此顯著不同,以類似的方式,以這個例子代碼: data(dune) data(dune.env) dune.dist <- vegdist(dune) attach(dune.env) dune.ano <- anosim(dune.dist, Management) summary(dune.ano) 然而,在我自己的數據中