10
A
回答
12
這個想法是迭代地將你的雲點分成兩部分。換句話說,您將構建一個隨機二叉樹,其中每個分裂(具有兩個子項的節點)對應於將雲中的點分割爲2.
您從點雲開始。
計算其矩心(重心)瓦特
選擇雲
的點中隨機CL的點相比瓦特時構建點Cr作爲CL的對稱點(分段CL-> w是相同W-> CR)
獨立的兩個雲點,那些最接近爲Cr屬於subcloud R,和那些最接近CL屬於subcloud L
重申,subclouds R和L
注:
可以丟棄隨機點一旦你使用它們。但是,保持所有子模塊的質心。
當你的子云包含正好一個點時停止。
如果您想要k個羣集,只需取k個質心,使其包含初始雲的所有點。如果你願意,你可以做更多更復雜的事情(最小化雲的變化等)。假設你想要4個集羣(爲了方便起見,兩個冪)然後你只需要將你的雲切成兩半,然後切割每個集羣在兩個subclouds。如果你想要8個簇,那麼再次將這些子云分成兩份。再次爲16個集羣。
如果你想K個K的集羣不是2的冪(比方說24),那麼看看最接近的二個冪。現在是16個。你還缺少8個集羣。每個「level-16-cluster」是「level-16-subcloud」的質心。你要做的是取8個「16級集羣」(例如隨機),並將它們分別替換爲兩個「子級」「32級集羣」。 (這兩個孩子的「32級集羣」對應於兩個「級別-32-subcloud」,加起來就是父級「level-16-subcloud」)
相關問題
- 1. Leader聚類算法解釋
- 2. 平分文檔聚類的KMeans
- 3. 計算Kmeans聚類的誤差
- 4. 如何使用kmeans聚類解釋更高百分比的點變異?
- 5. 使用scipy kmeans進行聚類分析
- 6. 聚類算法的功能縮放(規範化)(如Kmeans&EM)
- 7. 如何格式化Spark Spark kmeans聚類算法的數據?
- 8. 聚類基線比較,KMeans
- 9. 解釋聚類指標
- 10. 數字聚類/分區算法
- 11. 聚類視覺可分簇的算法
- 12. 聚類算法的性能分析
- 13. 如何計算kmeans在tfidf矩陣中解釋的方差?
- 14. 聚類標籤和聚類中心(R中的kmeans)
- 15. 使用mahout進行Kmeans聚類
- 16. Kmeans聚類識別R中的知識
- 17. Kmeans聚類和文本挖掘在R
- 18. KMEANS文本數據進行聚類
- 19. kmeans聚類與數據框(scipy)
- 20. 將kmeans聚類結果導出到.csv
- 21. Kmeans聚類如何在tensorflow中工作?
- 22. opencv kmeans聚類的輸入矩陣
- 23. R繪製kmeans與熱圖聚類
- 24. CLAHE算法解釋
- 25. Kruskal算法解釋
- 26. FASTA算法解釋
- 27. 如何解決這與kmeans聚類和使用餘弦similiraty
- 28. KMeans中的數據聚類使用二叉樹結構的算法
- 29. 如何分類但不使用分類或聚類算法?
- 30. KMeans算法在opencv中
感謝您的回答,現在更加清晰。但是我有兩件事我不明白 - 「在雲的點之間隨機選擇一個點」 - 意味着我需要選擇一個隨機向量? 第二件事 - 我不明白我需要爲K羣集做什麼? – Nir
那麼,你有一堆你想要聚類的點,對吧?在雲中選擇一個點意味着......在雲中選擇一個點=)我不完全明白你的意思是隨機矢量......在雲中選擇點,而不是在整個空間中隨機選擇。我已經更新了K簇的帖子 – Fezvez
我猜矢量mean point =]但是如果我的隨機選擇不好,並導致不均勻分裂簇呢?我雖然在做:我會選擇擁有最大SSE的集羣 - 你認爲什麼? – Nir