我讀了巨大CSV
與日期字段格式爲YYYYMMDD
,我用下面的λ將其轉換閱讀時:熊貓:慢日期轉換
import pandas as pd
df = pd.read_csv(filen,
index_col=None,
header=None,
parse_dates=[0],
date_parser=lambda t:pd.to_datetime(str(t),
format='%Y%m%d', coerce=True))
這個功能是很慢的,雖然。
任何改善它的建議嗎?
NaN出現問題:'return s.apply(lambda v:dates [v]) KeyError:nan' – ppaulojr
奇怪,我無法重現它,我們可以看到你傳遞給函數的序列?你的Pandas版本是什麼? – fixxxer
哇:這是超級!我有1M行測試文件,它需要1秒鐘的時間來閱讀(無日期解析),但是如果我打開parse_dates,則需要1分20秒。 0.4秒到最初的1秒read_csv()。 – jdmarino