我在一個文件夾中有5個csv文件,在這裏我想將每個csv文件中的所有列合併到一個數據框中。當我只加入2個csv文件時,效果很好,但是當我想加入5個csv文件時,我遇到了一個錯誤。我的代碼如下如下:使用熊貓在一個文件夾中加入多個csv文件[MemoryError:]
In [7]:
import pandas
import os
import numpy as np
import glob
path =r'D:/PreprocessingITRC/output/All/'
allFiles = glob.glob(path + "/*.csv")
dataframe = pandas.DataFrame()
for file in allFiles:
df = pandas.read_csv(os.path.join(file),index_col=0, header=0)
dataframe = dataframe.join(df, how='right')
dataframe
---------------------------------------------------------------------------
MemoryError Traceback (most recent call last)
錯誤似乎很明顯,文件有多大? –
你能解釋一下這5個dfs之間的關係嗎?它們是行式還是列式大型數據示例的一部分?在這種情況下,它可能工作,如果你只是一個列表添加每個df到這個列表,然後調用'pd.concat(df_list)' – EdChum
@PadraicCunningham總大小隻有9 KB –