我有一個需要合併到一個目錄中的n個文件。他們有列相同數量的,例如,test1.csv
內容是:在python中使用熊貓將csv文件附加到一個
test1,test1,test1
test1,test1,test1
test1,test1,test1
同樣,test2.csv
內容是:
test2,test2,test2
test2,test2,test2
test2,test2,test2
我想final.csv看起來像這樣:
test1,test1,test1
test1,test1,test1
test1,test1,test1
test2,test2,test2
test2,test2,test2
test2,test2,test2
但是,相反它出來是這樣的:
test file 1,test file 1.1,test file 1.2,test file 2,test file 2.1,test file 2.2
,,,test file 2,test file 2,test file 2
,,,test file 2,test file 2,test file 2
test file 1,test file 1,test file 1,,,
test file 1,test file 1,test file 1,,,
有人能幫我弄清楚這裏發生了什麼嗎?我粘貼了以下代碼:
import csv
import glob
import pandas as pd
import numpy as np
all_data = pd.DataFrame() #initializes DF which will hold aggregated csv files
for f in glob.glob("*.csv"): #for all csv files in pwd
df = pd.read_csv(f) #create dataframe for reading current csv
all_data = all_data.append(df) #appends current csv to final DF
all_data.to_csv("final.csv", index=None)
爲什麼你只用熊貓來創建一個單一的csv? –
我是一個noob,我認爲這是最好的方式來做到這一點。 :/ –