0
A
回答
0
以這從Wikipedia Article說明對固化算法
簡短的回答是運行的複雜性
- 運行時間爲O(n^2的log(n) )
- 空間複雜度爲O(n)
對於數據庫應用程序,這是一個相當高的運行的複雜性,所以你可能將它的問題直接向大型數據庫
根據維基百科,這個限制可以使用以下方法
得到緩解
- 隨機抽樣:隨機抽樣支持大數據集。通常隨機樣本適合主存儲器。隨機抽樣涉及精度和效率之間的折衷。
- 分區:基本思想是將樣本空間分割成p個分區。每個分區都包含n/p個元素。第一遍對每個分區進行部分聚類,直到對於某個常數q≥1最終聚類數減少到n/pq。對n/q進行第二次聚類傳遞部分聚類分區。對於第二遍,僅存儲代表點,因爲在計算合併羣集的代表點之前,合併過程僅需要先前羣集的代表點。分割輸入會減少執行時間。
- 在磁盤上標記數據:僅給定k個羣集的代表點,其餘數據點也會分配給羣集。爲此,選擇k個簇中每個簇的隨機選擇的代表點的一小部分,並將數據點分配給包含最接近它的代表點的簇。
相關問題
- 1. 向WEKA添加CURE聚類算法
- 2. Mapreduce 1算法的缺點
- 3. 字分類算法專業缺點
- 4. 缺點運算符「|」在Erlang
- 5. Reason的缺點(:)運算符在哪裏?
- 6. 不同的邊緣檢測算法有哪些優缺點
- 7. Lamport的發生前算法有什麼缺點?
- 8. 點簇算法
- 9. 圓點算法?
- 10. Graphviz點算法
- 11. R缺失數據插補的算法
- 12. 有缺陷的插入算法
- 13. 插入排序算法的缺陷
- 14. 我的貪婪算法有缺陷嗎?
- 15. 單片方法 - 缺點
- 16. 內聯方法:缺點
- 17. 算法計算最大點在點集
- 18. Java靜態方法優點和缺點
- 19. PHP中的靜態方法的缺點
- 20. Qt的缺點
- 21. node.js的缺點?
- 22. CouchDB的缺點
- 23. SQLite:ANALYZE的缺點
- 24. linq2sql的缺點
- 25. plist的缺點?
- 26. PHP二十一點算法算法
- 27. 計算點對稱性的算法
- 28. 計算幾何設定點算法的
- 29. cuda虛擬方法的缺點
- 30. 算法臨界點