1
我有一個聚類挑戰......聚類分組挑戰 - 聚類對成組
我有數據的許多對(例如甲< - > B,C < - > d,E < - > F,A < - > F等等) 我需要將它們分組爲\ N,例如組#1:A,B,F組#2:C,D。 聚類應用給定的對關聯(即A和B被配對)
任何想法做什麼?我相當確定有這樣的算法,但不知道如何尋找它們。
我有一個聚類挑戰......聚類分組挑戰 - 聚類對成組
我有數據的許多對(例如甲< - > B,C < - > d,E < - > F,A < - > F等等) 我需要將它們分組爲\ N,例如組#1:A,B,F組#2:C,D。 聚類應用給定的對關聯(即A和B被配對)
任何想法做什麼?我相當確定有這樣的算法,但不知道如何尋找它們。
首先,您是否知道數據在分析之前應具有的羣集數量?
如果是,那麼你可以沿着k-means的方式做一些事情(http://en.wikipedia.org/wiki/K-means_clustering)如果沒有,那麼你可以使用社區結構發現算法來探索可能性(http://en.wikipedia.org/wiki/Community_structure)
是 - 我可以定義簇的數量。 我知道K-mean需要某種「距離」來定義。不知道我在這裏怎麼做。社區結構看起來有趣。 謝謝! – user1042960 2012-03-05 03:49:42
對,呃。那麼如果距離測量很難算出來,你也可以看看Block模型算法。我喜歡http://arxiv.org/abs/1008.3926,但讀一篇研究論文可能是一個簡單的應用程序可能是矯枉過正。有許多不同的塊模型算法,所以谷歌搜索可能會有助於找到一個「適合」。 – 2perdo 2012-03-05 17:42:10
是的,恐怕對我來說有太多的希臘字母了:-) 我發現了我的距離等價物,但沒有找到K均值所需的座標。因此,我現在關注K-mediods - 似乎是最好的(考慮到工作成本)。 我會告訴你 – user1042960 2012-03-05 22:27:29