2017-01-25 34 views
0

我要生成來自塊,如DF:CSV塊或離線

chunksize = 1 
df_list = [] 
for chunk in pd.read_csv(filename, chunksize=chunksize): 
    df_list.append(chunk) 
data_raw = pd.concat(df_list) 

但是計算機的RAM只有3GB,和CSV文件超過3GB如下:

a b c  d  e  f  g  h i j ...  \ 
0 2 2 0 8.17680 4.76726 25.6957 1.13633 0 3 4.8 ...  
1 3 0 0 8.22718 2.35340 15.2934 1.13633 0 3 4.8 ... 

我想通過塊生成一個df文件,以分離數據來訓練X,在某些領域測試y,比如「ae」訓練X,「gh」在那之後測試y。單獨函數的輸入類型是df。 你能否給出一些具體的例子來從大塊或csv離線生成df?

回答