k-means

    0熱度

    1回答

    我使用rapidminer在8000個文件上運行k-means運算符並在Excel工作表中打印輸出。在檢查集羣結果時,我看到一些集羣是空的並且沒有任何文件,這是正確和正常的嗎?我給出k = 90和最大運行= 1000的值。

    -1熱度

    1回答

    我有1500名患者肺部的圖像,我試圖在他們身上應用kmean來解決我的問題。我的問題是,我想對一名患者(有230張圖像)應用k均值,然後保存此患者的質心,我想根據此質心對其他患者應用kmeans。這是matlab代碼。 [idx,C] = kmeans(data,80) 現在,我有C但我應該怎麼做才能使用它並將該質心應用於其他圖像? 這裏'我的數據看起來像,我是基於這些圖像的直方圖聚類。 Img1

    0熱度

    1回答

    使用K均值聚類時,我刪除了獨立變量的前5位和後5位百分位數值,因此我在幾個數據點上丟失了數據。 現在我使用K均值聚類後,我得到每個數據點的聚類。我如何獲得先前由於異常值而被刪除的數據點羣集

    1熱度

    1回答

    我想看看是否有一個點在「肘形圖」,這將有助於我選擇在K意味着K算法 但是,我注意到WSSSE有時增加K隨着增加。我的假設是WSSSE會隨着K的增加而減少。我附上一張顯示此圖片的圖片以及Pyspark代碼。 enter image description here

    0熱度

    1回答

    繼回答這個問題 How to convert type Row into Vector to feed to the KMeans 我創建了功能表我的數據。(assembler是一個Vector彙編) val kmeanInput = assembler.transform(table1).select("features") 當我跑k均值與kmeanInput val clusters =

    0熱度

    1回答

    我試圖使用Elbow和BIC方法估算Kmeans中K的數量.X是多維數據點數組(100000個數據點X 100個特徵) 這裏是我用於彎頭: Ks = [40,50,60,70,80,90,100,110,120] ds = [] for K in Ks: cls = MiniBatchKMeans(K, batch_size =1000, random_state = 101)

    -2熱度

    1回答

    我有在Python陣列由具有不同尺寸的多個不同的陣列組成,例如: KB=[[[1,2],[2,4],[2,4,5,3],[5,4,3,2,1]],[[1,2],[2,4],[2,4,5,3], [5,4,3,2,1]],........] 基本上,陣列中的每個條目具有固定數量的可以用不同尺寸表徵的子陣列(第一個條目具有2-D,第三個條目具有4-D等等)。 現在,使用在python

    0熱度

    1回答

    假設我已經做了多種操作和相關值的創建的集羣矢量如下所示 D <- matrix(rexp(10*10,rate=.1), ncol=10) #create a randomly filled 10x10 matrix C <- matrix(rexp(10*10,rate=.1),ncol=10) DCor <- cor(D) # generate correlation matrix C

    -2熱度

    1回答

    的結果,所以我不知道是否已經被重複之前我的查詢。 我對樣本數據集執行k = 3的k均值聚類,算法返回所需的聚類結果。現在我想繪製第2簇的結果,以查看第2簇中的成員彼此隔開多遠。我會怎麼做?由於 name <- sample(letters[1:25]) age<-sample(20:50, 25, replace=FALSE) salary <-sample(2000:10000, 25, r

    0熱度

    1回答

    我試圖使用高維數據集(CDR數據)的K均值。 集羣后,我謹代表每個集羣與最翔實的特點能展現出獨特的/代表客戶在該集羣的特徵。 例如, 羣集1:高:call_duration],[低:NUMBER_OF_FRIENDS],[高:call_at_night] 羣集2: [低:call_duration],[高:use_promot離子] 集羣3:高:internet_usage] 我想知道......