hierarchical-clustering

    0熱度

    1回答

    在Hierarchical Dirichlet Process中,作者使用中餐廳特許權解釋了HDP。它說每家餐廳都有很多餐桌,不同的餐桌可能在一家餐廳共用一道菜。這裏的菜我們可以認爲是文檔中的一個主題,那麼如何理解每個文檔中的表?我認爲不同的餐桌應該訂購不同的菜餚,如果兩張桌子有相同的菜,那麼爲什麼不把它們合併成一個?非常感謝。

    -1熱度

    1回答

    我有一個龐大的時間序列數據集。爲了可視化Python中的聚類,我想繪製時間序列圖和樹狀圖,如下所示。 我試圖通過使用Python中subgrid2plot()函數來做到這一點,通過側創建兩個次要情節的一面。我用系列圖填充第一個,用樹狀圖填充第二個。但是,一旦時間序列數量增加,就會變得模糊不清。 有人可以提出一個很好的方式來繪製這種類型的樹狀圖嗎?我有大約50,000個時間序列進行聚類和可視化。

    0熱度

    2回答

    我正在與一大組,其包括空間包裹的工作的附加屬性,與含有地理座標的每一行(UTM),局部地區&值: [x, y, area, value]: [272564.9434265977, 6134243.108910706, 980.63, 550.6664083293393], [272553.9611341293, 6134209.499155387, 1026.55, 477.326968973

    -1熱度

    1回答

    我有幾個桶。每個桶包含許多標籤(字符串)。如何根據相似性或重疊將桶集中在一起? E.g. 剷鬥一個: '鴕鳥', '麻雀', '蜂鳥', '斑馬', '藍鴉' 剷鬥B: '香蕉', '西瓜', '葡萄', '胡蘿蔔' 鬥C: '芹菜', '生菜', '菠菜', '香蕉', '胡蘿蔔' 鬥d: '麻雀', '狗', '貓', '獅子',「大象','馬' 在這個非常非常小的例子中,B + C會使一個羣

    0熱度

    1回答

    我有一個基於他們選擇的數碼相機功能的128個響應者的二進制數據。其中'1'代表功能的選擇,'0'代表未選擇的功能。我有92個產品功能列和響應行。每個響應者已經從92個功能中精確選擇了20個功能。我想根據所選功能創建不同用戶組的羣集。我已經嘗試了一些聚類算法,如模糊聚類和hierarichal這些binaray數據,但它沒有給我任何好的結果,創建的集羣非常糟糕。所以現在我已經在數據w.r.t響應中應

    1熱度

    1回答

    我使用的包FactoMiner和其功能HCPC之間的差異。然後我用的功能plot.HCPC(),我觀察到的(兩種選擇出相同的結果...) library(FactoMineR) data(USArrests) pca <- PCA(USArrests, ncp = 3, graph = FALSE) hcpc <- HCPC(pca, graph = FALSE) 這個函數有兩種選擇之間的差異。如

    0熱度

    1回答

    我無法理解這dendoHeirarchial Clustering克在R.請幫我這個

    0熱度

    1回答

    我使用gplots R包中的heatmap.2()函數,這是一個奇妙的函數。 該函數使用hlcust構造樹來重新排序數據。我的問題是,hclust不能使用Neighbor-Joining方法來構造樹。 我的問題是,我如何使用Nj算法和heatmap.2函數。 我試圖heatmap.2(hclustfun =函數(X)NJ(X))與NJ()是從包猿一個函數來計算NJ樹,但是我有以下問題: Error

    4熱度

    1回答

    我試圖使用sklearn的聚集聚類命令執行約束聚類。爲了使算法受到限制,它請求「連通性矩陣」。這被描述爲: 約束經由連接矩陣施加的連接:只在一個行的交叉處,並與應連接的數據集的索引的列具有元素SciPy的稀疏矩陣。這個矩陣可以由先驗信息構成:例如,你可能希望只通過將鏈接合併到一個指向另一個的鏈接來聚合網頁。 我有一個觀察對列表,我希望算法將強制保留在同一個集羣中。我可以將其轉換爲稀疏scipy矩陣

    0熱度

    1回答

    我目前正在關注文檔主題中的層次結構。作爲第一步,我找到了我的文檔的向量表示,然後使用分層聚類來確定文檔的主題內是否有主題。我只想考慮(嵌套的)至少包含2個原始數據的集羣。爲了達到這個目的,我使用R. 現在,我正在努力從聚類結果中有效地提取集羣層次結構。集羣使用「fastcluster」軟件包完成,它提供與原始「hclust」功能類似的結果。 對於我的最終輸出應該看起來像這樣;將有兩個表 集羣分配: