2016-03-03 48 views
0

我有一個客戶位置流式傳輸數據,如果位置是他通常訪問的位置,我需要分析和檢查每個事件,如果不是他通常訪問的位置,則實時生成警報。 我正在尋找各種聚類算法,但找不到一個能夠「實時」處理的算法。地理位置集羣

K均值是centriods的數量過於死板.. DBSCAN是沉重的重量,不知道它的速度不夠快的實時響應...

您能否提供一個,它適合實時流處理?

+0

一個好的DBSCAN實現可以很好地擴展。 –

回答

0

我相信DBSCAN已經夠用了。其最壞情況下的複雜度爲O(n2),與其他傳統算法(如分層結構)相比,它足夠體面。與kmeans相比,如果您使用來自空間數據庫(如SpatiaLIte或PostGIS)的ST_Centroid函數(理所當然地使用地理數據),我相信kmeans是適用的。 在kmeans和DBSCAN之間,我選擇DBSCAN,因爲我認爲您的問題的答案是關於實時數據的基於密度的方法。