2013-01-24 69 views
2

我想知道什麼是cluster map markers的最佳途徑?我們目前在我們的應用程序中使用Google地圖,其中每個實體都在地圖上定義了一個點,並且具有用於聚集實體點的grid based clustering algorithm (64px X 64px grid)。這對大約8萬個實體很好。我們的數據集從5000到150萬個實體不等。 1.5 million dataset的問題在於,如此多的標記,地圖上的幾乎每個網格都是一個聚集標記,這不僅會導致UI(每個網格上的聚集標記)不良,而且會增加地圖的加載時間。聚類谷歌地圖標記

1)Client Side - 我試過客戶端聚類(Map Clusterer)。哪個沒有用,因爲json對象本身有150萬個實體會減慢系統的運行速度,Map Clusterer也只能運行多達5萬個標記。

2)Server Side - 這樣龐大的數據集的問題是,我甚至無法查詢所有的實體,所以我想在SQL中有一個基於網格的第一級聚類,然後在獲得第一個聚類後進行一些基於密度的聚類從SQL傳遞集羣結果,每個集羣都有一個clusterCount和avg lat/long。 或者如果對於如此巨大的數據集有一個更好的主意,(我讀了MAFIA, CLIQUE集羣http://www.siam.org/proceedings/datamining/2001/dm01_07NageshH.pdf)。另外,在某些時候,我真的想緩存這些數據(儘管應該在單獨的問題中提出這個問題),但是如果有人也可以提供一些緩存技術記住羣集,請查看端口和縮放級別,那會非常有幫助。

+0

在這一點上,我會採取任何一個答案......有沒有人嘗試過K-手段或四樹聚類? – user1045047

回答