hierarchical-clustering

    5熱度

    1回答

    我有一個四個用戶之間的相似矩陣。我想做一個凝聚聚類。代碼是這樣的: lena = np.matrix('1 1 0 0;1 1 0 0;0 0 1 0.2;0 0 0.2 1') X = np.reshape(lena, (-1, 1)) print("Compute structured hierarchical clustering...") st = time.time() n_c

    1熱度

    2回答

    I have a matrix x= [[0,1,1,1,0,0,0,0], [1,0,1,1,0,0,0,0], [1,1,0,1,0,0,0,0], [1,1,1,0,0,0,0,0], [0,0,0,0,0,1,1,1], [0,0,0,0,1,0,1,1], [0,0,0,0,1,1,0,1], [0,0,0,0,1,1,1,0],] 主叫AgglomerativeCl

    0熱度

    1回答

    我的數據集包括在150個港口取得的15000個魚市樣本。不幸的是,採樣不是均勻分佈,有些港口具有1-10個樣品,和其他人有1000,我想這些港口聚集在一起,讓我實現以下兩個: 港口在地理彼此靠近聚集在一起 最終的聚類都具有大致相似的採樣密度,例如1000個樣本 項目#1可以使用基於距離的標準聚類自行完成。但是,我怎麼能在這個之上實現#2呢?我應該看什麼工具/方法? (最好在R中)

    0熱度

    1回答

    我試圖在Apache SOLR中啓用僱主集羣(子集羣生成)。爲此,我使用SOLR集羣組件,將「outputSubclusters」參數設置爲true。 但是,當我以JSON顯示輸出時,從集羣過程收到的對象不顯示任何子集羣,這讓我想知道......我在這裏錯過了什麼? 這裏是我的solrconfig.xml中羣集部件: <searchComponent name="clustering"

    0熱度

    1回答

    我想進行分層聚類並繪製帶有熱圖的經典樹狀圖。在R中使用heatmap.2或heatmap.3是相當容易的,而且在python中看起來也很容易。然而,我沒有真正找到一個好的解決方案是樹的註釋。 理想情況下,我想根據元數據爲我的分支着色代碼。假設我有5個不同類型的〜10K行,在聚類之後,我想要查看這些類型如何組合在一起。由於數據量的原因,標記每行並不可行。 基於簇/距離對樹進行着色似乎不是不可能的,但

    2熱度

    2回答

    我在循環下面的數組,其中有多個條目。在這個例子中,我有3個元素,其中每個元素都有3個值。 [0] ['name'] => 'aaa' ['id'] => 38679 ['parent-id'] => 0 [1] ['name'] => 'bbb' ['id'] => 38830 ['parent-id'] => 38679 [2]

    0熱度

    1回答

    我正在嘗試將我正在使用的數據集的部分組合在一起。我有一羣工作在各種不同技能的人。這個想法是獲得最大的代理和技能代表。 因此,在一個完美的場景中,最好能夠獲得包含85-90%記錄的代理樣本以及代表85-90%記錄的一組技能。基本上,我想獲得最大的百分比樣本,而不需要小羣體的代理人,這些代理人只使用少數幾種技能,或者只有很少一部分代理人使用的技能。 我想找到一個更統計的方法來做到這一點,並思考有關羣集

    1熱度

    1回答

    我有data.frame,例如: test<-data.frame(matrix(c(1:5,2:6,3:7),nrow=3)) test<-cbind(rbind(exp(test),test),rbind(test,2*test)) test # X1 X2 X3 X4 X5 X1 X2 X3 X4 X5 # 1 2.718282 54.598150 20.08554

    1熱度

    1回答

    我正在使用Agglomerative分層集羣方法對一組數據進行集羣。我用於聚類的數據集是一個軌跡。 我使用自定義距離函數來估計軌跡之間的距離。 matlab代碼如下:Z = linkage(ID,'single','@ my_distfun'); 聚類後的數據;我想找到代表性的實例(或軌跡)。 如何找到每個羣集的代表性實例(軌跡)?

    -2熱度

    1回答

    你好假設我有一個集羣內的下列變量 1.1 0 1.9 0 0 1.3 0.6 0.6 0.6 現在,我怎麼找到這個集羣的重心?