2

我正在使用weka.classifiers.bayes.HMM嘗試對我的一些數據進行分類,但似乎無法找到我的ARFF文件應該如何顯示的任何示例......文檔對我來說並不是很清楚。在Weka中使用HMM

所以我明白,HMMs需要時間序列數據,我的問題是如何在我的數據集中表示?我是否應該在每條特徵線前添加另一個「數字」索引?例如,這裏是我的特徵線的3(總共有十萬10秒,但都遵循這種格式):

2,2.217950,2.235440,0.031252,2.224833,2.301141,0.093227,1.940765,1.973835,0.064434,1 2,2.216870,2.235608,0.035570,2.217950,2.235440,0.031252,2.023161,2.531513,0.623939,1 2,2.216577,2.246109,0.045806,2.216870,2.235608,0.035570,2.497010,2.529199,0.050049,1

每一行都包含幾個能量讀數,它們都按順序排列:第一行出現在第一行,第二行在第二行讀數後出現1秒,第三行,1秒等。

如何使用HMM在韋卡訓練這套球衣? (是的,我知道我需要一個單獨的測試數據集,這也是一個時間序列)

謝謝!

+0

我忘了提及我需要5個狀態:1,2,3,4,5。他們應該以一定的概率從一個到另一個。例如,如果當前時隙處於狀態3,則更可能進入狀態2和4,而不是1和5. 狀態位於最後一行(作爲示例在下面編輯): 2, 2.217950,2.235440,0.031252,2.224833,2.301141,0.093227,1.940765,1.973835,0.064434,1.2.216870,2.235608,0.035570,2.217950,2.235440,0.031252,2.023161,2.531513,0.623939,2,2.216577,2.246109,0.045806,2.216870, 2.235608,0.035570,2.497010,2.529199,0.050049,3 – stellarowl12

回答

2

HMMweka 主頁:

的HMM分類器僅在序列的數據,這在Weka中是表示爲一個關係屬性工作。數據實例必須具有單一的名義類屬性和單個關係序列屬性[...]

2

我有同樣的問題,並且同樣是新的,所以任何更正將不勝感激,但這是我想出的。

有在下載時非常有用的例子,特別是numericsequence.arff你想這樣的作品格式:

@relation relation_name 
@attribute name_of_instance_attribute {instance_0,instance_1,...instance_n} 
@attribute class {relation_type_0, relation_type_1, ... relation_type_n} 
@attribute name_of_sequence relational 
    @attribute sequence_variable_0 type 
    @attribute sequence_variable_1 type 
@end sequence_variable_1 type 
@data 

instance_0,relation_type_n,'5,6\n7,8\n9,10' 
instance_1,relation_type_n,'2,3\n4,5\n6,7' 

可以肯定,如果你正在編寫一個程序來寫你的ARFF您插入「\ n」而不是換行符,它似乎想要一行文字'\ n'而不是一個真正的換行符。

+0

我在哪裏可以下載numericsequence.arff?謝謝, – Foreverniu

+0

這是在HMM weka下載 – Empiricist