我一直使用Mahout來使用XML和SOLR索引輸入的k-means集羣文本文檔。Mahout ClusterDump - 顯示graphml輸出時的奇數結果
聚類看起來很有效,類似的文件確實被放在同一個k-means聚類中,這很好。但是,無論何時使用ClusterDump顯示graphml輸出(--outputFormat GRAPH_ML),我都會得到一個顯示所有集羣的圖,但每個元素顯示在其父集羣周圍,這意味着每個元素都具有大致相同的半徑從質心。
我期待元素散佈在整個集羣中,這取決於它們彼此之間的相似性(如Mahout示例)。
有沒有人見過與他們的Mahout k-means集羣類似的東西?我試圖深入瞭解這一點,但任何暗示或建議都將是一個巨大的幫助。
有了太多的感謝,
P莫里斯