2011-02-05 44 views
7

我有2個關於分析GPS數據集的問題。比較/聚類軌跡((x,y)點的GPS數據)和挖掘數據

1)提取軌跡我有一個巨大的數據庫記錄的GPS座標形式(latitude, longitude, date-time)。根據連續記錄的日期 - 時間值,我試圖提取該人所遵循的所有軌跡/路徑。例如;從時間M開始,(x,y)對不斷變化,直到時間N。在N之後,(x,y)對中的變化減少,此時我得出結論,從時間MN的路徑可以稱爲軌跡。當提取軌跡時,這是一種體面的方法嗎?有什麼可以建議的着名方法/方法/算法嗎?是否有任何數據結構或格式可以幫助我以高效的方式維護這些點?也許,對於每個軌跡,計算出速度和加速度會很有用?

2)挖掘軌跡一旦我有所有的軌跡/採取的路徑,我怎麼能比較/羣集他們?我想知道起點或終點是否相似,那麼中間路徑如何比較?

如何比較2個路徑/路徑,並得出它們是否相似。此外;我如何將相似的路徑聚集在一起?

我非常感謝,如果你能指點我的研究或類似的事情。

開發將在Python中進行,但歡迎各種圖書館建議。

在此先感謝。

+2

Check out您的標籤。他們都不是很受歡迎。我會考慮將`gps`改爲`gis`,並確定添加`python`標籤。 – 2011-02-06 19:08:17

+0

您可能會考慮在http://gis.stackexchange.com/ – radek 2011-02-06 22:20:42

回答

9

查看蘇黎世大學地理系完成的工作,特別是Patrick LaubeSomayeh Dodge

看一看紙

個體運動和地理數據挖掘。聚類 算法高亮熱點在個人導航路線

linkpresentation)。它展示了在GPS數據中使用DBSCAN核密度估計方法。

同樣來自諾基亞的Mobile Data Challenge 2012 Workshop論文在這兒可以幫忙,特別是:

MobReduce:減少流動性狀況複雜的費邊哈特曼,克里斯托弗P.梅耶,英格瑪Baumgart跟蹤(link

用於軌跡聚類的軌跡清理框架(link

作者:Agzam Idrissov,Mario A.阿爾伯塔大學納西門託

1

1)提取軌跡 我認爲你是正確的方向。 GPS數據中可能會有一些噪音,隨機行走,你應該做一些光滑的樣條來克服它。


2)採礦軌跡 是否有類似的軌跡任何商業意義? (這將有助於建立距離度量標準,然後你可以使用一些mahoot聚類算法) 1.我認爲有些人停留的地方更有趣,所以你可以生成地方受歡迎程度的統計數據。 2.如果您需要路由相似性來查找到相同起始端的不同路徑,則需要將首個起始端位置和類似曲線(最大距離間距,積分距離 - 一些衆所周知的功能度量標準)聚類到一起。