cluster-analysis

    -1熱度

    1回答

    我通過使用函數hclust進行聚類,現在我想繪製每個簇周圍的多邊形! 我該怎麼做?我只有一組具有集羣ID的點! 例如這個圖像有兩個類和4個不同的區域!我如何獲得這些區域的數量?

    1熱度

    1回答

    我想在R中運行聚類練習。我使用的算法是apcluster()。我使用的腳本是: s1 <- negDistMat(df, r=2, method="euclidean") apcluster <- apcluster(s1) 我的數據集有大約10萬行。當我跑了劇本,我得到了以下錯誤: Error in simpleDist(x[, sapply(x, is.numeric)], sel,

    -1熱度

    1回答

    我的數據集大約有數千行(或大約數百個RDF三元組的數百行)。從表格的角度來看,每行表示一個人參與一些過程。數據嘈雜,似乎是單獨的個人可能實際上是同一個人。 根據規則,我需要權威地爲每個在數據中建模的獨特人員分配新的標識符,但我甚至不知道這種做法是否有名稱。 我熟悉各種聚類方法,但這對我來說似乎不同。我不知道真正的數字獨特的個人,我不想找到他們之間有最小距離的個人。我想找到符合我的合作者提供的一些規

    2熱度

    1回答

    我有一個字母和不同顏色的形狀的圖像。我需要對它們執行kmeans聚類,然後提供兩個不同的圖像,一個只重新生成形狀,另一個只重新生成Letter信號。 這是一個示例原始圖像和我需要實現的。 Original Image Shape color regenerated 並且類似地,另一個只用白色R. 我已經成功地進行k均值聚類算法,如何訪問標籤和集羣IDX再生預期的效果?有人可以請示例代碼說明。這是代

    1熱度

    2回答

    我想要做的事情的簡單例子: 比方說,我有3個數據點A,B和C.我運行KMeans聚類在這個數據上,得到2個簇[(A,B),(C)]。然後我對這個數據運行MeanShift集羣並獲得2個集羣[(A),(B,C)]。很顯然,這兩種聚類方法以不同的方式聚集數據。我希望能夠量化這種差異。換句話說,我可以使用什麼度量來確定從兩種算法獲得的兩個羣集組之間的相似性/重疊百分比?下面是可能被給予分數的範圍: 10

    0熱度

    1回答

    我正在處理需要使用集羣的數據。 我知道Spark框架不會讓我有一個單一的羣集;最小數量的聚類是兩個。 我創建了一些虛擬隨機數據來測試我的程序,並且我的程序顯示錯誤的結果,因爲我的KMeans函數正在生成一個集羣!怎麼來的?我不明白。是因爲我的數據是隨機的嗎?我沒有在我的kmeans上指定任何東西。這是處理K均值代碼的一部分: kmeans = new BisectingKMeans(); mod

    0熱度

    2回答

    我有一大組診斷代碼序列,我試圖根據相似性進行聚類。我通過使用最小公共子序列算法計算相似性,然後從1中減去該相似性來找出每個序列之間的距離,從而創建了一個距離矩陣。 我然後通過了距離矩陣成sklearn的DBSCAN爲這樣: db = DBSCAN(eps=0.34, metric='precomputed') db.fit(sim_mat) 創建簇後,I輸出中包含的每一個到一個文本文件的序列

    1熱度

    1回答

    我正在寫一個聚類算法,對於其中的一部分,我計算了每個聚類點的歐幾里得距離矩陣。 (僅供參考,所有這些都在Tensorflow中)。每個聚類都是一個8維向量的列表,然後我變成一個M * 8矩陣。對於每個羣集中的每個點,我想找到它與其最近的鄰居之間的距離。我相信最有效的方法是計算每個簇的點之間的成對距離,然後在得到的M×M矩陣的每一行中找到第二小的值(因爲每一行中的最小值總是0,給定點與其自身之間的距

    0熱度

    1回答

    我使用的Weka的聚類方法將類似的字符串模式如何使用聚類方法將類似的字符串模式。我已經使用首先WEKA的fo​​nction「stringtowordVector」,然後我直接使用聚類一些methodes,但我不能得到正確的結果,可能有人給我一些正確的方法來組這類數據?這是我的數據的一小部分: @relation ponds @ATTRIBUTE LCC string @data acegi

    2熱度

    1回答

    我要測試的霍普金斯統計從comato包霍普金斯()函數outputed和我使用下面的可再現的代碼: #@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@ # # SIMPLE EXPERIMENTS TO CHECK THE