2014-05-21 84 views
0

我有不同時間創建的大量文檔。我想暫時集羣這些文件。按時間聚類文檔

我想將文檔聚類爲具有相關時間戳的文檔組。例如,如果在時間X創建的文檔數量中存在「峯值」,則它們將被分組到相同的簇中,依此類推......

假設我們不知道可能有多少個簇。

+2

谷歌「爆檢測」,「秒殺檢測」,「峯值檢測」。你在看文件的事實在很大程度上是不相關的,只是將它們看作點事件。 –

回答

1

如果你不知道有多少個星團,那麼增加新的天然氣就是很好的算法。 你可以在這裏玩的演示:http://www.demogng.de/

在你的任務,你需要1D的情況。

您可以在這裏找到的實現方式之一:https://github.com/BelBES/libGNG