2016-03-23 201 views
0

我有一個字符串數組,其中該數組的每個元素都是一個csv文件的行(逗號分隔)。我想將它轉換成熊貓數據框。但是,當我逐行嘗試時,它非常緩慢。除了writelines()和pandas.read_csv()之外,可以提出更快的備選方案嗎?快速從字符串數組轉換爲熊貓數據框

+1

交示例代碼和數據 – EdChum

+0

'pd.read_csv( 'yourfile.csv')'。不需要將csv文件的內容放入列表(而不是數組)中並對其進行迭代。 –

回答

0

CSV進口

在大熊貓可以不用遍歷行一次讀取整個csv

使用read_csv與文件名作爲參數:

import pandas as pd 
from cStringIO import StringIO 

# Set up fake csv data as test for example only 
fake_csv = ''' 
Col_0,Col_1,Col_2,Col_3 
0,0.5,A,123 
1,0.2,J,234 
2,1.4,F,345 
3,0.7,E,456 
4,0.4,G,576 
5,0.8,T,678 
6,1.6,A,789 
''' 

# Read in whole csv to DataFrame at once 
# StringIO is for example only 
# Normally you would load your file with 
# df = pd.read_csv('/path/to/your/file.csv') 
df = pd.read_csv(StringIO(fake_csv)) 

print 'DataFrame from CSV:' 
print df 

DataFrame from CSV: 
    Col_0 Col_1 Col_2 Col_3 
0  0 0.5  A 123 
1  1 0.2  J 234 
2  2 1.4  F 345 
3  3 0.7  E 456 
4  4 0.4  G 576 
5  5 0.8  T 678 
6  6 1.6  A 789 
+0

謝謝! U保存了一天 –

+0

@SiddharthMuthukumar 很高興我能幫忙! [記住接受,你獲得+2聲望!](http://meta.stackexchange.com/a/5235/292533) – tmthydvnprt

相關問題