2017-05-21 50 views
1

的數據集我有一個dataset.csv文件看起來像這樣如何解析特性與用戶特定的日期格式

time, cost,volume,valid 
Fri May 19 10:00:00 PDT 2017, 9.1,3.2,True 
Fri May 19 11:03:09 PDT 2017, 5.2,4.2,False 

你能幫分析該數據集這樣的數據類型爲:列1:日期,列2:浮動,欄3:浮動,column4:布爾

感謝 CG

回答

1

您可以使用read_csv與參數skipinitialspaceparse_dates

import pandas as pd 
from pandas.compat import StringIO 

temp=u"""time, cost,volume,valid 
Fri May 19 10:00:00 PDT 2017, 9.1,3.2,True 
Fri May 19 11:03:09 PDT 2017, 5.2,4.2,False""" 
#after testing replace 'StringIO(temp)' to 'filename.csv' 
df = pd.read_csv(StringIO(temp), skipinitialspace=True, parse_dates=[0]) 
print (df) 
       time cost volume valid 
0 2017-05-19 10:00:00 9.1  3.2 True 
1 2017-05-19 11:03:09 5.2  4.2 False 

print (df.dtypes) 
time  datetime64[ns] 
cost    float64 
volume   float64 
valid    bool 
dtype: object 
+0

這真棒,謝謝jezrael –

+0

好吧,它與樣品很好。它也適用於真實的數據? – jezrael