2017-06-22 198 views
0

我想讀取一個CSV文件並將其保存爲熊貓中的數據幀。用不同的分隔符(逗號)閱讀熊貓的csv

但是我有一個問題,因爲我有行是這樣的:

BG,6141.6,6141.6,,3.0,,,ic 

正如你看到有三個分離:',,,'',,',

我該如何正確加載它變成熊貓嗎?

+2

你應該在數據仔細看,很有可能是多個分離器將意味着你的數據有8列,但列4,6和7這個特定的行是空的 – Vaishali

+0

是因爲列是空的還是其他原因? –

+0

你應該說明你已經嘗試了什麼,以及爲什麼你認爲它沒有工作。 – bli

回答

2

使用正則表達式分隔[,]+ - 一個或多個,

import pandas as pd 
from pandas.compat import StringIO 

temp=u"""iBG,6141.6,6141.6,,3.0,,,ic""" 
#after testing replace 'StringIO(temp)' to 'filename.csv' 
df = pd.read_csv(StringIO(temp), sep="[,]+", header=None, engine='python') 
print (df) 
    0  1  2 3 4 
0 iBG 6141.6 6141.6 3.0 ic