Q
文檔聚類
-2
A
回答
5
The Wikipedia article on document clustering包括鏈接從弗吉尼亞理工大學2007年的論文由尼古拉斯·安德魯斯和愛德華·福克斯稱爲「Recent Developments in Document Clustering」。我不確定具體是什麼你會被稱爲「人工智能算法」,但掃描論文的內容表明他們看向量空間模型,kmeans的擴展,生成算法,譜聚類,降維,基於相位的模型和對比分析。這是一個相當數學上密集的處理,但他們很小心地引用他們談論的算法。
2
聚類確實是AI域中的一類問題。如果你想降低一級,你可以說它在機器學習領域。從這個意義上講,AI不會改進文檔聚類,但可以解決它! Dumbledad mentions一些基本的選擇,但你每次的數據類型可能會更好地用不同的算法處理。這個問題有很多基於k-means的方法。在這種情況下需要仔細播種。球形k-均值(搜索Dhillon的論文)是一種簡單而標準的方法。其他擴展名是k-synthetic prototypes。
子空間聚類也是一個很好的嘗試,一般來說,如果您想要比「文檔聚類」文獻檢查「高維和稀疏數據空間中的聚類」更進一步。
相關問題
- 1. 按時間聚類文檔
- 2. 文檔聚類/分類中的功能?
- 3. 在Python中對文檔進行聚類
- 4. 不同文檔類型的聚合
- 5. Python的K均值對文檔聚類
- 6. 文檔聚類的似然相似性
- 7. 文檔聚類和可視化
- 8. Objective-C中的文檔聚類
- 9. 文檔聚類基礎知識
- 10. 平分文檔聚類的KMeans
- 11. 聚集組嵌套文檔
- 12. 將概念上類似的文檔聚類在一起?
- 13. 文本聚類
- 14. 基於PSO和K-means的文本文檔聚類R
- 15. 聚合物:使用App-IndexedDB的鏡與聚合物文檔應用-pouchdb文檔
- 16. Bigquery - 文本聚類
- 17. 使用K-means算法進行文檔聚類
- 18. 要聚類的文檔的最大限制
- 19. K-means文檔聚類 - 下一步是什麼?
- 20. 文檔聚類的第一步的選項
- 21. RavenDB將文檔映射加載到POCO或域聚合根類?
- 22. 聚類和kmeans有不清楚的文檔
- 23. 聚類超過3個文檔時Kmeans進行異常緩慢
- 24. 什麼是使用elasticsearch做文檔聚類的便捷方式?
- 25. Mongodb聚合從文檔內部檢索文檔
- 26. 合併子文檔主文檔與MongoDB的聚集
- 27. 文本文件聚類
- 28. 檢索文檔頻率與聚合
- 29. 德爾福 - 保持Word文檔聚焦
- 30. elasticsearch中子文檔的子聚合?