水平合併多個CSV(鍵,值)文件和名稱'在產生的DF value`列我有一個目錄中的16個不同的CSV文件,我試圖將其裝入一個大熊貓數據幀。每個文件有datetime
和float64
列。所有的CSV文件都沒有列標題。目錄熊貓:如何使用文件名
location = os.path.join(base_dir, "DirectoryName")
symbols = os.listdir(location)
df = pd.DataFrame(index=dates)
for symbol in symbols:
location = os.path.join(base_dir, "DirectoryName", symbol)
df_temp = pd.read_csv(location, index_col=0, parse_dates=True, dayfirst=True, na_values=['nan'])
df_temp.dropna()
df_temp.index = df_temp.index.normalize()
df_temp = normalize_data(df_temp)
df = df.join(df_temp)
,我現在的問題是最終的數據框df
有datetime
,因爲它的索引,但它的相應的行值列名和第一行充滿了NaN
我必須刪除第一行df
,但這對於執行其他操作沒有多大幫助,因爲有些數據會丟失。我無法重命名列標題,因爲它對每個文件都不同,我只知道如何靜態更改。
如果你的列'對於每個文件都不同',你將如何將所有的CSV文件合併/加入到單個DF中?你想水平合併它們嗎? – MaxU
如果您將鏈接發送到一個/兩個CSV文件或在這裏發佈一個文本形式的小數據樣本,那麼幫助您會容易得多... – MaxU
所有文件都有第一列的共同點,我用它作爲索引。這裏是文件鏈接@MaxU https://drive.google.com/folderview?id=0B2I8HUL0xRSWVlZNb1hHckRwRVE&usp=sharing – harindersingh