2013-07-08 101 views
0

我已經應用集羣交易算法如K均值,K-medoid和DBSCAN對我的病人的數據集。對於每個ALGO RapidMiner生成集羣模型(質心表和圖表等)和聚簇集(顯示哪些實例是羣集的一部分)。現在我想要某種方式,當一個新病人來時,我想根據以前的訓練模型爲他分配一個聚類。我很困惑,要做到這一點..的方式是類似的東西,我可能是錯的如何在質心基羣集中重新聚類新實例?

新病人的每個屬性值 - 從心表 該屬性值總結病人和採取的屬性的所有分歧平均。

然後分配給他的集羣,其平均最小相對於該患者。

如果這是正確的方法,那麼我將如何重新聚類,即當新病人來我們的算法是分配他的羣集,這是有意義的。質心移動,然後我不得不重新聚集每個記錄插入。如何在我的情況下處理這個問題?

+0

這個問題屬於上stats.stackexchange.com –

回答

0

看看在線聚類算法,如果你想將它們應用到流。

存在諸如在線k-means變體等事物。

通常,您的確希望避免重新聚集所有現有示例,因爲這對於無限數據流和有限內存不起作用。

通常這是一個好主意不是嘗試得到完全相同的結果,如果你運行了經典的聚類算法,但學會忍受一些錯誤。畢竟,所有這些算法無論如何已經只是啓發式。只要你的近似是好的,近似啓發式就沒有錯。