2016-08-05 229 views
0

我有沒有標題的csv文件中的數據。我需要解析一些列。熊貓:從csv解析列

數據的一部分:

-1.0,-0.0246259814315,1174.60023796 
1.0,-0.978057706084,1083.19880269 
-1.0,0.314271994507,-1472.97760911 
-1.0,0.179751565771,231.017267343 
1.0,-1.26254374278,-778.271726463 
-1.0,0.249969939456,-52.8014826538 
1.0,-1.87039747875,-324.235348241 

我需要加載僅第二和第三列。我用train_X = pd.read_csv("perceptron-train.csv", sep=',', parse_dates=[1], usecols=[2, 3])但它返回IndexError: list index out of range

+1

你需要用方括號括起來:'tra in_X = pd.read_csv(「perception-train.csv」,parse_dates = [1])'也適用於usecols,你應該通過列名或列的序號位置列表 – EdChum

+1

使用'parse_dates = [1]'並保留記住列索引是從零開始的。 – albert

+0

@EdChum如果我想要展示兩列,我應該使用兩個支架? – ldevyataykina

回答

1

IIUC指數是從零開始的,所以你需要:

train_X = pd.read_csv("perceptron-train.csv", sep=',', parse_dates=[1], usecols=[1, 2]) 

此外,我不知道這是否也意味着你需要更改日期西:

train_X = pd.read_csv("perceptron-train.csv", sep=',', parse_dates=[0], usecols=[1, 2]) 

然而,看着你的數據我不明白如何解釋第一或第二列作爲日期時間,因爲它們看起來很奇怪