0

我正在嘗試學習一些數據挖掘和機器學習的實踐技巧。我剛剛實現了k-means聚類算法,並且據我所知可以正常工作。我知道它可以找到以前沒有任何結構的數據中的模式,但我的問題是,我現在可以利用這些信息做些什麼?我想讓我的代碼進入下一步,所以我很好奇 - 一旦我有一堆文檔的集羣,那麼如何幫助我理解數據呢?我能用這個新發現的信息做什麼?更具體地說,我正在尋找一個編碼項目,這將使我的羣集實現更上一層樓。K-means文檔聚類 - 下一步是什麼?

+0

閱讀比k-means更類似的算法,這就像聚類的kNN分類器一樣! –

回答

1

K-均值等聚類算法組項目,並提供有關您的文檔集有用的信息,然後聚類可以用來

  1. 找到相關文檔
  2. 有你的一套簡短概述

當使用不同的度量和不同羣集可以提供給用戶標籤視圖或圖表那樣

http://blog.cluster-text.com/tag/cluster/