0
我想聚集一些文本文檔以找到具有相同概念的文檔。我已經使用潛在語義分析(LSA)完成了語義相似性,但我混淆了我應該爲我的目的選擇哪種聚類方法。 謝謝爲潛在語義分析選擇適當的聚類方法
我想聚集一些文本文檔以找到具有相同概念的文檔。我已經使用潛在語義分析(LSA)完成了語義相似性,但我混淆了我應該爲我的目的選擇哪種聚類方法。 謝謝爲潛在語義分析選擇適當的聚類方法
您可以使用層次聚類。 R中有一個名爲RClusterpp的包,它對大數據的分層聚類非常有效(它執行並行計算)。然後,您可以在可能範圍內爲樹狀結構樹切割不同數量的簇,並使用交叉表檢查簇配置文件。