2012-09-14 62 views
3

沒有人知道在python軟件包,可以選擇一些在一個非常大的無向圖簇(100,000節點和大量的邊緣),從而作爲簇總和內,以儘量減少平方距離或類似的東西?我考慮看看MCL現在:http://micans.org/mcl/圖聚類在Python,Hadoop的,或其他

+0

100K節點並不大。即使有一個完全圖的鄰接矩陣僅將需要4 * 100000^2個字節= 37.252903千兆字節(假設邊權重可存儲在單精度),其就可以得到在單個EC2實例。 Hadoop過度殺毒,你有沒有試過在networkx中做這個? – dranxo

+0

雅可能會被殺。我沒有看到任何會讓我在Networkx上的派系之外的節點聚集的東西。如果有可用的話,我想要做譜聚類,但似乎只有光譜二分性纔會返回某種常數。第二次看後,networkx可以給我拉普拉斯的特徵值,所以也許我就可以用它來執行譜聚類。 – rfoley

回答

1

它看起來要麼象夫譜聚類或本MCL算法中,因爲我的工作。