2012-03-30 73 views
2

我比較錄得5年(2007- 2011年),其中的測量,在每年數爲每小時數據測量如下:包括閏年比較時間序列

2007 = 8760 measurements; 
2008 = 8784 measurements; <-- leap year 
2009 = 8760 measurements; 
2010 = 8760 measurements; 
2011 = 8760 measurements; 

什麼是最好的方法比較每個時間序列?對於非閏年的2月29日增加24個測量值(nans)是否更好?或者,將數據內插到相同的時間框架(其中時間以年的十進制日給出)是否更有效?

+0

你試圖做什麼比較?數據集不對應,所以你可能不會像like一樣進行比較。 – walkytalky 2012-03-30 09:55:26

回答

2

完全取決於您所測量的數據類型。如果它是像天氣數據那樣的自然世界的東西,那麼你可能更關心的是將冬至和春分配到春分。如果是金融市場數據,則可能需要排列日曆,並可能完全排除閏日。

在沒有更多背景的情況下很難提供更具體的建議。

+0

這些數據表示水溫。因此,我看着溫度如何從一年到另一年不同,並且可能找到相關性,數據需要與此相同。 – Emma 2012-03-30 10:14:50

+2

如果您匹配季節性標記,例如冬至和春分,數據將匹配。比賽完全不符合日曆年。 – 2012-03-30 10:16:20