2012-07-10 62 views
1

我需要實現基於自定義距離的分層聚類算法。通過在數據庫中查找與正在比較的對象的兩個ID相關聯的值來計算距離。 有沒有簡單的方法在Java中做到這一點?我看了一下Weka和他們的自定義距離函數,但是我找不到定義實例的方法,這樣當我處於自定義距離函數中時,我可以獲取兩個原始對象的ID。自定義距離分層聚類

任何幫助將不勝感激 感謝很多提前 羅塞拉

+0

http://elki.dbs.ifi.lmu.de/wiki/Tutorial/DistanceFunctions 他們有SLINK,它是O(n^2)運行時中的單鏈接層次聚類(而不是O(n^3),這是實現它的微不足道的方式)。您可能需要加載包含您的ID的虛假數據集。 – 2012-07-10 11:54:24

回答

0

您可以在Apache Mahout中看看。 這裏是鏈接Mahout Hierarchical clustering

這個工具是用Java及其開源編寫的。

+0

......並且它在其他數據庫設計上不能很好地發揮作用。 – 2012-07-10 11:51:59