我想合併&附加不同的時間序列,從csv文件導入它們。我曾嘗試以下基本代碼:如何索引從導入的CSV文件的日期時間列 - pandas
import pandas as pd
import numpy as np
import glob
import csv
import os
path = r'./A08_csv' # use your path
#all_files = glob.glob(os.path.join(path, "A08_B1_T5.csv"))
df5 = pd.read_csv('./A08_csv/A08_B1_T5.csv', parse_dates={'Date Time'})
df6 = pd.read_csv('./A08_csv/A08_B1_T6.csv', parse_dates={'Date Time'})
print len(df5)
print len(df6)
df = pd.concat([df5],[df6], join='outer')
print len(df)
,其結果是:
12755 (df5)
24770 (df6)
12755 (df)
應該不是隻要df,可以是國內最長的兩個文件(其中有很多共同點行的,在['Date Time']列中的值的條款)??
我試圖指數基於日期時間的數據,加入這一行:
#df5.set_index(pd.DatetimeIndex(df5['Date Time']))
但是我收到的錯誤:
KeyError: 'Date Time'
爲什麼發生這種情況的任何線索?
謝謝。 代碼'df5 = pd.read_csv('./ A08_csv/A08_B1_T5.csv',index_col = ['Date Time'],parse_dates = ['Date Time'])'returns'ValueError:'Date Time'is not in列表' – Andreuccio
你是否仍然需要從'Date Time'列設置索引?或者現在沒有必要? – jezrael
如果需要,'df5 = pd.read_csv('./ A08_csv/A08_B1_T5.csv',parse_dates = ['Date Time'])'print df.dtypes'後面是什麼? – jezrael