我正在尋找一種方法來做一些數據聚類分析。這是我的聯盟出路,但我知道它可以完成。我正在尋找方法將我擁有的數據聚類在一起,並以可視方式呈現。一個想到的是樹狀圖,但我也接受其他建議。使用LAMP進行聚類分析
是否有任何腳本或類已被寫入,可以幫助我完成此任務?我更喜歡留在LAMP內。
謝謝。
我正在尋找一種方法來做一些數據聚類分析。這是我的聯盟出路,但我知道它可以完成。我正在尋找方法將我擁有的數據聚類在一起,並以可視方式呈現。一個想到的是樹狀圖,但我也接受其他建議。使用LAMP進行聚類分析
是否有任何腳本或類已被寫入,可以幫助我完成此任務?我更喜歡留在LAMP內。
謝謝。
我知道的最完整的開源工具是用於文檔聚類的carrot2開源框架。它們主要是以Java和.NET爲中心的,但可以通過REST接口與Ruby和PHP5一起使用。應該相對容易地融入您選擇的任何框架中。
這是他們的主頁 - http://project.carrot2.org/index.html
這是他們自己的集羣引擎和可視化,圓可視化您可能感興趣的(一旦你輸入查詢有3個可視化輸出標籤,這是中間的一個)的在線演示 - http://search.carrot2.org/stable/search
這是他們的商業產品lingo3g - http://search.carrotsearch.com/carrot2-webapp/search。在對大多數查詢進行聚類時速度提高了6-8倍,對結果進行了不同(更好的)聚類,並提供了分層聚類和相應的可視化。如果你想使用它,你可以申請一個試用版,你可以給他們發一封電子郵件,他們會給你訪問所有相應的材料(如carrot2開源代碼下載)和一個2個月的試用許可證。
如果這不是你想要的,你只想要一個原始的庫集合,你也可以檢查出apache的mahout項目。