我目前正在研究時間系列女巫430屬性和約。 80k實例。現在我想對每個實例進行二進制分類(而不是整個ts)。我發現的關於對TS進行分類的一切都是關於標記整個事情的。 是否有可能用SVM之類的東西來分類每個實例,完全忽略數據的順序特性,還是隻會導致一個非常糟糕的分類器? 還有哪些其他選項可以將每個實例分類,但仍將數據視爲時間序列?分類多變量時間序列
回答
它當然取決於430屬性中的數據, 數據類型和特別是你想解決的問題。
在時間序列分析中,您通常要利用相鄰點之間的依賴關係,即它們如何隨時間變化。你可能會在書中找到的例子通常談論一個功能。如果我理解正確,那麼您只需關注430個屬性之間的依賴關係(垂直依賴關係)並忽略水平依賴關係。如果我是你,我會首先嚐試訓練多個分類器(支持向量機,最大熵模型,多層感知器,隨機森林,概率神經網絡......),並比較他們在你的框架中的預測性能問題。
對於培訓,您可以開始將所有430個屬性作爲特徵提供給Maxent分類器(可以輕鬆處理數百萬個特徵)。 您還需要執行一些N-fold交叉驗證以查看分類器是否過度配置。然後選擇最好的解決您的問題「夠好」。
如果這種方法不能很好地執行其他的想法:
- 包括T-1,T-2功能...
- 通過嘗試不同特徵的子集進行特徵選擇
- 派生出新時間序列,如移動平均,小波頻譜......並將它們用作新特徵
Maxent分類器的一個很好的實現可以在openNLP中找到。
如果數據被標記了,你可能會把運算連在一起,所以每個實例變成一個單獨的長時間序列,並且通過應用所謂的Shapelet Transform。這將導致每個時間序列的值可以輸入到SVM,隨機森林或任何其他分類器中。這可能是因爲選擇正確的shapelets將允許您在分類實例時專注於單個屬性。
如果沒有標記,您可以先試用unsupervised shapelets應用程序來探索您的數據,然後繼續上述shapelet轉換。
感謝您對shapelet轉換紙的鏈接。 – 2016-05-02 14:53:44
@seninp我只是偶然發現了你的答案。出於好奇,你認爲可以將shapelet變換應用於面板/橫截面時間序列數據嗎?在文獻中,我通常只看到它適用於實際價值的時間序列。 – Pylander 2016-09-13 20:19:02
- 1. LSTM時間序列分類
- 2. 時間序列分類MATLAB
- 3. 時間序列分類
- 4. R,單變量時間序列中的時間序列預測
- 5. 創建時間序列變量
- 6. 金融時間序列中的變量
- 7. R系列時間序列分析 - 除時間段以外的多個輸入變量
- 8. 從時間序列中提取熊貓月份分類(虛擬)變量
- 9. 使用協變量的時間序列分析
- 10. 從一個數據框中創建多個時間序列對象,分類變量爲列,日期爲行
- 11. 分配時間給變量
- 12. d3.js分類時間序列(evolustrip)
- 13. 在R中繪製多變量時間序列的問題
- 14. 使用RNN預測多變量時間序列
- 15. 拆分時間變成3個變量
- 16. 分類。變量
- 17. 時間序列分析
- 18. 15分鐘時間序列
- 19. 將時間序列分組
- 20. R中的時間序列:如何計算R中多個時間序列變量的固定年份的變化百分比?
- 21. 多點時間序列
- 22. 多元時間序列
- 23. R:添加虛擬變量列到xts時間序列對象
- 24. weka中的多級分類變量
- 25. 分類變量的多重共線性
- 26. 分配多個接口變量類型
- 27. XStream的反序列化時,變量的類型改變
- 28. 大熊貓變換時間序列爲多列數據幀
- 29. 靜態成員變量分配時間
- 30. 未將時間分配給DateTime變量
正在爲您的數據要求其他分類器...... – Devavrata 2014-09-21 12:57:11