2016-03-06 48 views
2

我試圖將CSV文件讀入熊貓數據框並選擇列,但不斷收到關鍵錯誤。read_csv後在pandas數據框中選擇列時出現的關鍵錯誤

該文件讀取成功,我可以在iPython筆記本中查看數據幀,但是當我想選擇除第一個以外的列時,它會引發關鍵錯誤。

我使用這個代碼:

import pandas as pd 

transactions = pd.read_csv('transactions.csv',low_memory=False, delimiter=',', header=0, encoding='ascii') 
transactions['quarter'] 

這是我工作的文件: https://www.dropbox.com/s/imd7hq2iq23hf8o/transactions.csv?dl=0

謝謝!

回答

12

使用sep='\s*,\s*'這樣你會照顧的空間中列名:

transactions = pd.read_csv('transactions.csv', sep='\s*,\s*', 
          header=0, encoding='ascii', engine='python') 

或者你可以確保你沒有不帶引號的空格在您的CSV文件,並使用您的命令(不變)

證明:

print(transactions.columns.tolist()) 

輸出:

['product_id', 'customer_id', 'store_id', 'promotion_id', 'month_of_year', 'quarter', 'the_year', 'store_sales', 'store_cost', 'unit_sales', 'fact_count'] 
+0

你真了不起!非常感謝!! –

相關問題