2017-10-11 56 views
0

我正在使用carrot2的STC(後綴樹聚類)算法對一堆文檔進行聚類。默認情況下,算法形成的最大羣集數爲。有沒有辦法決定生成的集羣數量?確定在Carrot2中的簇大小設置

以下是調用STC羣集的代碼。

ProcessingResult byDomainClusters = controller.process(documents, null, STCClusteringAlgorithm.class); 
List<Cluster> clustersByDomain = byDomainClusters.getClusters(); 
ConsoleFormatter.displayClusters(clustersByDomain); 

回答

1

爲了獲得更多的集羣,嘗試增加maxClustersmaxBaseClusters參數的值。以下是如何pass parameter values in Java code

但是,數量較少的羣集也可能是由輸入數據的特徵造成的(文檔太少?)。要驗證這一點,請嘗試使用Lingo算法對數據進行聚類。