如何識別類似的旅程模式並將它們分組爲R中的組？

我試圖找到一種比較1000+的汽車旅程與彼此以集羣相似的旅程的方式。（最好在R中）如何識別類似的旅程模式並將它們分組爲R中的組？

在下面的例子中，每一行是某個特定日子的一個人的旅程。

每列代表停車點。沒有考慮時間，只是旅程的順序。例如stop1，stop2，stop3 ... stop10

數據將包含NAs，因爲並非所有旅程都有10個站點。

例子：矩陣（row.names代表一個獨特的人）：

row.names, stop1, stop2, stop3, stop4, stop5, stop6 ... stop10 
    1  34  23  16 283  12 453 ... 
    2  34  23  16 283  12 453 ... 
    3  34  23  16 122  12 NA ... 
    4  62  72  90 11  NA NA ... 
    5  62  90  11 NA  NA NA ... 
    6  46  39  46 83  73 3 ...

我是新來的聚類，但已研究過不同類型的（K均值，層次）。

我嘗試過使用熱點地圖和parellel座標，但他們沒有yeiltded我正在尋找的視覺效果 - 即它不是很容易看到超過1000+旅程的團體，我不認爲它適用於旅程可能與其他類似。

我希望有人可以幫助提供一個例子，他們有類似於這個聚類數據，並解釋它，所以它是明確的初學者？

非常感謝

來源

2013-10-27 darkCode

你的數據集包括位置，所以它有一個地理維度。而不是隻看數字ID，得到每個點的座標並繪製它們。這可能比任何簡單的聚類都要多得多。

或者，如果地理編碼不可行，則可以將其視爲關聯規則（購物籃分析）問題。每次旅行代表一個籃子，並且位置ID是每個籃子中存在的項目。

來源

2013-10-27 14:40:55

不幸的是，我無法訪問地理數據，也無法從當前數據中對其進行解密。我對使用MB分析方法的建議感興趣。你能否提供更多關於我如何在R中這樣做的細節，以便找到類似的旅程模式？ – darkCode

如何識別類似的旅程模式並將它們分組爲R中的組？

回答

相關問題