2015-10-16 76 views
3

我有一個時間序列數據設定爲csv文件與以下columns-如何適應數據到隱馬爾可夫模型sklearn/hmmlearn

ID,TIMESTAMP,MEASUREMENTS[10] 

對於ID多個測量是否有與所述相關聯的時間戳時這些測量做了。列測量值包含10個測量值的列表。一個記錄中的測量(與特定時間戳相關)在某種程度上取決於之前的記錄。

例如。的數據集:

ID,TIMESTAMP,MEASUREMENTS 
1,0,[123,456,567.....] 
1,100,[....] 
1,350,[....] 
2,0,[....] 
2,200,[.....] 

此外,測量數組在某些索引處包含NaN。 最後,我有一些與每個ID相關的標籤,這是直到該ID的最後時間戳執行的測量的結果。 我的目標是將這些數據放入一個HMM模型中,然後預測具有相同格式的測試數據集的標籤。 如何將此模型放入HMM模型sklearn/hmmlearn? sklearns文件不符合模型的標記,沒有參數解釋。

+0

你解決了這個問題嗎?我認爲我們有類似的問題 –

回答

2

由於您的問題需要預測下SQUENCE的標籤。您應該使用seqlearn這是一個序列分類工具。

而且,在HMM擬合數據將需要一些預處理因爲它接受陣列的列表。您可以按時間升序連接時間戳和與每個ID相關的三個測量值。這會爲每個ID提供一個長度爲33的序列。

讓我知道你是否需要進一步的幫助。我最近將HMMLearn用於一個項目。