目的:上預製的指數數據清洗後果
要創建容納預先存在的一系列價格數據從CSV文件的索引。我可以使用列表推導構建一個索引。如果以這種方式完成的話,那麼施工會給我一個長度爲86,772的過濾清單 - 當運行超過1/3/2007-8/30/2012 42次時(即10分鐘間隔)。但是,我的csv價格數據長度爲62,034。請注意,長度差異是由於數據清理問題。
這就是說,我不知道如何克服真實數據和這個預建(列表比較)數據幀之間的明顯不匹配。
嘗試:我使用的前兩行不正確
是誰?
data=pd.read_csv('___.csv', parse_dates={'datetime':[0,1]}).set_index('datetime')
dt_index = pd.DatetimeIndex([datetime.combine(i.date,i.time) for i in data.index])
ts = pd.Series(data.prices.values, dt_index)
問題:
據我瞭解,我應該使用 '合併',因爲我想指數編制由我csv文件完全知情。並且,'combine'返回一個新的datetime對象,其日期分量等於給定的日期對象,並且其時間分量等於給定的時間對象。
當我parse_dates時,它是否把時間和日期合併在一起,並認爲它是'日期'?
有沒有更好的方法來實現既定目標?
回溯錯誤:
AttributeError: 'unicode' object has no attribute 'date'
我添加了一個例子,我的答案,但我認爲這可能是添加的第一個有用你的數據集中有幾行(例如輸出數據[:3]')。您的日期或時間可能是畸形的,並且沒有正確轉換? –