我有一個場景,我必須將操作系統數據集羣化。 實際數據包含 151位使用Windows的用戶,27位使用MAC的用戶,5位使用Linux的用戶。使用Carrot2 API與Lingo3GClusteringAlgorithm集羣化數據的問題
使用Lingo3gClusteringAlgorithm與Carrot2 API進行聚類後, 獲取羣集結果爲 MAC OS用戶27,Linux用戶5和最後所有Windows用戶都在其他主題羣集。 但是,如果我將Windows用戶作爲單獨的羣集,那就太好了。 因此,爲了讓Windows成爲一個單獨的集羣,我需要配置哪些集羣屬性。 目前僅使用「組合集羣分數餘額」與值:1.0。 任何幫助表示讚賞
Carrot2執行無監督的基於文本的聚類,所以結果永遠不會完美。如果你可以讓你的數據集在某個地方可用,我們可以檢查它是否可以進一步調整。 –
嘿@StanislawOsinski對於遲到的回覆感到抱歉。感謝您的幫助。這裏是我發佈數據的鏈接 https://pastebin.com/VgNUdjdM。使用以下配置(「組合集羣分數平衡」,「1.0」); (「active-language」,「ENGLISH」); \t(「max-cluster-size」,1.0);用羣集算法作爲Lingo3GClusteringAlgorithm.class – Pavan