2015-08-25 73 views
-1

我們有一系列帶滑行位置的序列。我們希望通過考慮數據行中的順序模式來對數據進行聚類。 例如: T1,T2,T3,T4是行程,a,b,c,d,e是一組地點。 我們已經是像數據,使用可變長度數據輸入和EM算法聚類

  • T1 B C B A d
  • T2一個
  • T3 A B A B A B Cëd
  • T4 B C d C B d℃的

但問題是該數據的長度是不變量。我們如何使用EM對這些類型的數據進行聚類。由於它不接受可變長度的數據,所以我們可以自定義它。 謝謝

回答

1

EM是一般原則。您可以使用它與非常不同的型號

可能最流行的EM模型是高斯混合建模,GMM。

當然,如果你使用協方差,GMM 需要一個固定的維數。

但是,如果您使用其他模型,沒有理由不能使用可變長度向量。例如,有EM處理文本數據的變體,文本通常具有不同的長度。