2013-06-12 109 views
0

我正在尋找perl,python甚至LISP中用於處理時間序列數據的開源庫。數據將從CSV文件讀入:數據運行長度通常爲兩年每10分鐘一次。任何人都可以推薦一個庫,允許我將數據加載到對象中,例如,從數據集中排除13:00到19:00之間的所有星期日,或者方便地創建一個包含我想要排除的所有時段的對象,以及對原始數據集進行AND運算。必須能夠處理每個時間採樣超過一組值。用於時間序列數據的庫

我已經看過python的熊貓,它看起來很有前途,任何其他人都會想到?

回答

2

大熊貓無疑是一個很好的選擇。 R語言對時間序列也有很好的支持。

from pandas import Series, date_range 
from numpy.random import randn 
rng = date_range('1/1/2011', periods=10000, freq='10min') 
ts = Series(randn(len(rng)), index=rng) 

filtered_index = rng[((rng.dayofweek!=6) | ((rng.hour < 13) | (rng.hour>=19)))] 
no_sunday_afternoons = ts[filtered_index] 
print no_sunday_afternoons['2011-01-02 12:30:00':'2011-01-02 19:30:00'] 


2011-01-02 12:30:00 -1.395918 
2011-01-02 12:40:00 0.382604 
2011-01-02 12:50:00 -0.422495 
2011-01-02 19:00:00 -0.341497 
2011-01-02 19:10:00 0.982950 
2011-01-02 19:20:00 -0.909796 
2011-01-02 19:30:00 0.842446 
dtype: float64 
+0

這正是我所追求的。感謝您花時間寫一個例子。 – djnz0feh

相關問題