2013-10-27 19 views
0

我試圖找到一種比較1000+的汽車旅程與彼此以集羣相似的旅程的方式。 (最好在R中)如何識別類似的旅程模式並將它們分組爲R中的組?

在下面的例子中,每一行是某個特定日子的一個人的旅程。

每列代表停車點。沒有考慮時間,只是旅程的順序。例如stop1,stop2,stop3 ... stop10

數據將包含NAs,因爲並非所有旅程都有10個站點。

例子: 矩陣(row.names代表一個獨特的人):

row.names, stop1, stop2, stop3, stop4, stop5, stop6 ... stop10 
    1  34  23  16 283  12 453 ... 
    2  34  23  16 283  12 453 ... 
    3  34  23  16 122  12 NA ... 
    4  62  72  90 11  NA NA ... 
    5  62  90  11 NA  NA NA ... 
    6  46  39  46 83  73 3 ... 

我是新來的聚類,但已研究過不同類型的(K均值,層次)。

我嘗試過使用熱點地圖和parellel座標,但他們沒有yeiltded我正在尋找的視覺效果 - 即它不是很容易看到超過1000+旅程的團體,我不認爲它適用於旅程可能與其他類似。

我希望有人可以幫助提供一個例子,他們有類似於這個聚類數據,並解釋它,所以它是明確的初學者?

非常感謝

回答

0

你的數據集包括位置,所以它有一個地理維度。而不是隻看數字ID,得到每個點的座標並繪製它們。這可能比任何簡單的聚類都要多得多。


或者,如果地理編碼不可行,則可以將其視爲關聯規則(購物籃分析)問題。每次旅行代表一個籃子,並且位置ID是每個籃子中存在的項目。

+0

不幸的是,我無法訪問地理數據,也無法從當前數據中對其進行解密。我對使用MB分析方法的建議感興趣。你能否提供更多關於我如何在R中這樣做的細節,以便找到類似的旅程模式? – darkCode

相關問題