我在嘗試羣集多個實體。我用於聚類的唯一指標是一個實體和另一個實體之間的相似性。 (一個0-1浮點)完全基於實體相似性的無監督聚類
任何人都可以想到任何聚類算法,將實現這一目標? 我很欣賞它將返回模糊組。這仍然是一個更好的解決方案,而不是像我目前那樣以編程方式評估團隊。
我在嘗試羣集多個實體。我用於聚類的唯一指標是一個實體和另一個實體之間的相似性。 (一個0-1浮點)完全基於實體相似性的無監督聚類
任何人都可以想到任何聚類算法,將實現這一目標? 我很欣賞它將返回模糊組。這仍然是一個更好的解決方案,而不是像我目前那樣以編程方式評估團隊。
作用於網絡(也稱爲圖 - 通過邊連接的節點)的所有聚類算法考慮了鄰域拓撲。其中有許多存在。我建議RNSC和MCL(免責聲明:我寫了後者)。詳細說明,簡單(未加權)網絡中的集羣結構可以以節點集的形式存在,其中實現了許多可能的連接。
您可以使用DBSCAN (Wikipedia)或OPTICS (Wikipedia)。當他們談論距離時,他們不需要度量屬性或任何東西 - 它們也可以與相似度函數一起使用!
我會在這裏稍微濫用評論系統,並提到下一個mcl版本將實現OPTICS。這是一個有趣的方法,儘管在我看來,它不是一個完整的解決方案,而是*沒有*單一算法。由於基於密度的方法,它比傳統的連接算法(尤其是單連接)更強壯,但仍然是該家族的很大一部分。我認爲,由光學產生的密度圖通常可以提供豐富的信息和有用的信息,但不一定要採用聚類方法。 – micans
@micans是否會提供完整的OPTICS實現,並提供Xi簇提取,還是每個人都從Weka複製的不完整的DBSCAN樣式? –
它如何比較基準與ELKI實施?這是一個相當快的實施AFAICT。 –
MCL看起來很適合這項法案。感謝那。你知道任何鏈接以編程方式展示它的使用嗎? –
您的意思是嵌入一些實現mcl的代碼,而不是將mcl實現作爲一個單獨的程序從外部調用?關於第一個,mcl相對容易實現(在micans.org/mcl網站上有一個非常小的perl實現),關於後者,一個強大的實現已經存在;但是也許你的意思是別的? – micans
是的,理想情況下,我希望能夠優化它在SQL服務器中使用。到目前爲止已經通過挑選 http://www.cs.ucsb.edu/~xyan/classes/CS595D-2009winter/MCL_Presentation2.pdf 這在解釋MCL方面很出色。 –