2013-05-09 28 views
0

如何區分兩個不同的用戶,例如居住在同一地址並前往同一辦公室的兩個不同的鄰居,但他們有不同的駕駛模式和不同的辦公時間表。我想找出兩個人的行爲或多或少精確的概率。根據地圖的分辨率,我想知道它們的位置,頻率。我可以爲每個駕駛員創建一個模式,將其設置爲可追蹤其身份的簽名。如何區分兩個居住在彼此附近的不同用戶?

+0

究竟是什麼語言? – imulsion 2013-05-09 12:38:35

+0

@imulsion這個問題更多的是關於統計和算法,而不是關於一種語言來表達它。 – paddy 2013-05-09 12:40:27

+0

我目前不使用任何語言,但正在研究這個想法。本主題基於Vanet Security。 – 2013-05-09 12:42:01

回答

0

我認爲,由你問你的問題,你還沒有得到任何合理的想法還的方式。所以我會做出一個完全基於您可能想嘗試的想法的答案。

我最初以爲這表明沿着字相似度量的東西線,但由於訂單不一定這裏很重要,也許這是值得嘗試簡單的東西開始。事實上,如果我在開發模型時發現自己考慮了一些複雜的事情,我會退後一步並嘗試簡化。編寫代碼更快,而且你不會對這種死衚衕感到束手無策。

那麼,直方圖怎麼樣?如果將時間和空間劃分爲更大的塊,則可以在每個時間間隔的相關位置增加一個值。你得到一個人的位置的二維直方圖。您可以使用基本的抗鋸齒功能使直方圖更具代表性。

從那裏,它的下跌給直方圖比較。您只能使用1D條實現一些真正的基本功能。你知道,就像總結每個垂直和水平條的相似性度量。線性直方圖比較非常簡單,只需像C這樣的語言中的幾行代碼即可。足夠用於概念驗證。如果感覺你在正確的軌道上,然後開始尋找更棘手的想法...

接下來我要做的事情是進一步分層我的數據,使用星期幾和法定節假日......也許甚至使用季節性變量進一步分層。我發現它對預測電力負荷非常有效,這與社會模式和天氣一樣多。當分離影響變量時,趨勢變得更加明顯。

所以,分層後,你得到的二維「切片」的堆棧,您的簽名變成了一種三維體積。把整個地球表現爲一個網格我沒有看錯。無論你的廣場代表100米還是1公里。很容易將這些稀疏地存儲起來,並剪掉任何超出標準偏差數量的東西。您可能只選擇當天最重要的活動,並最終獲得少量地點。

然後,您可以專注於比較度量。也許某種基於圖像的梯度或聚類分析。我確定那裏有很多非常棒的東西。這只是我做的一些起點,沒有做過研究。

如果您需要添加一些時間信息向人們介紹的分離具有非常相似的生活,你也許可以建立一些滯後到系統......如「他們在那裏一個小時前」。在那個時候(或者可能在之前),你可能想從我的過度簡化的平均出一個人的日常活動的方法轉向,而是使用類似分類樹的東西。用MATLAB或R這樣的工具開發這種東西是非常容易和快速的。

+0

感謝您的迴應。當我最初考慮數據的表示時,我想到了將數據裝箱並以直方圖格式表示。正如你之前提到的,在分箱時,整個地區被分成不同的多邊形並表示爲直方圖格式。我對比較指標感到非常震驚,並將每個個人身份都縮減爲一個簽名。 – 2013-05-09 15:29:22

+0

我不明白朮語「層疊之後,你會得到一堆2D'切片',你的簽名就變成了一種3D卷」你能簡要說明一下這部分嗎? – 2013-05-09 18:46:12

+0

當然......基本上你可以根據一些變量將你的數據分成組。星期幾是一個明顯的例子,因爲你會預期一個人的行爲模式會有所不同 - 至少在工作日和週末之間,如果不是個別日子的話。所以你爲每一天建立一個單獨的直方圖。如果你的直方圖是一個網格,你可以想象每個直方圖堆積起來,並顯示模式的變化。此時您決定如何比較直方圖。通常情況下,你只能比較週日和週日,但你的任務可能不同 - 有人可能會有不同的「週末」。 – paddy 2013-05-09 21:43:58

相關問題