我是時間序列分析的新人。我試圖找出短時間(1天)溫度時間序列的趨勢,並嘗試不同的近似值。而且,採樣頻率是2分鐘。數據爲不同的電臺配置。我會比較不同的趨勢,看看他們是否相似。時間序列分析趨勢的相似
我面臨這樣三個挑戰:
Q1 - 我怎樣才能提取模式?
Q2 - 我如何量化趨勢,因爲我會比較屬於兩個不同位置的趨勢嗎?
Q3 - 我什麼時候可以說兩個趨勢相似或不相似?
我是時間序列分析的新人。我試圖找出短時間(1天)溫度時間序列的趨勢,並嘗試不同的近似值。而且,採樣頻率是2分鐘。數據爲不同的電臺配置。我會比較不同的趨勢,看看他們是否相似。時間序列分析趨勢的相似
我面臨這樣三個挑戰:
Q1 - 我怎樣才能提取模式?
Q2 - 我如何量化趨勢,因爲我會比較屬於兩個不同位置的趨勢嗎?
Q3 - 我什麼時候可以說兩個趨勢相似或不相似?
Q1-如何提取圖案?
您將首先對兩個數據集執行時間序列分析。您需要一個統計庫來進行測試和比較。
如果您可以使用Python,pandas
是一個不錯的選擇。
在R中,forecast
包很棒。在兩個數據集上運行ets
開始。
Q2 - 我如何量化趨勢,因爲我會比較屬於兩個不同位置的趨勢嗎?
量化趨勢背後的想法是從尋找(線性)趨勢線開始。所有統計軟件包都可以幫助您。例如,如果您假設線性趨勢,那麼將數據點平方偏差最小化的線。
關於trend estimation的維基百科文章相當方便。 另外,請記住趨勢可以是線性的,指數的或衰減的。可以嘗試不同的趨勢參數來照顧這些參數。
Q3 - 我什麼時候可以說兩個趨勢相似或不相似?
在兩個數據集上運行ARIMA。 (這裏的基本思想是看看同一組參數(組成ARIMA模型)是否可以描述你的臨時時間序列,如果你在forecast
(R)中運行auto.arima()
,那麼它將選擇參數p,d, q對於你的數據,非常方便
另一個想法是對你的兩個系列進行雙樣本t檢驗並檢查p值的顯着性(注意:我不是統計學家,所以我我不知道是否有任何理論反對這樣做的時間序列)
雖然研究我碰到Granger Test - 其中的基本想法是看看一個時間序列可以幫助預測另一個。似乎很適用於你的情況。
所以這些只是讓你開始的幾件事。希望有所幫助。
您可以評論在Pandas/Python中實現(1) - 即,在python中的auto.arima()等價物。在下面的評論表明這種自動化是一項工作正在進行中:http://stackoverflow.com/questions/22770352/auto-arima-equivalent-for-python – Quetzalcoatl
@Ram請參閱您的答案後續行動,http:///stats.stackexchange.com/questions/172226/proving-similarities-of-two-time-series。 – Moe
一些評論:1.爲什麼要限制自己的線性趨勢線。一個更好的開始可能是將OP指向標準分解工具,將其分解爲季節性,趨勢和隨機組分,並使用黃土或類似趨勢。 2.在兩個數據集上運行ARIMA不會幫助您評估趨勢是否相似(嘗試並查看 - 請參閱http://stats.stackexchange.com/questions/172226/proving-similarities-of-two-time的答案) -系列。 –
這應該是交叉驗證的,因爲這是一個關於統計方法的問題,而不是編程。 –