2017-03-14 106 views
0

從數據摘錄:簡單的方法來從文本中提取日期熊貓

Givent大熊貓數據框的下面的例子:

df = 
     index    date 
     7838  2012 January 
     7790  2012 January 
     7853 2015 September 
     7889  2016 March 
     7928  2015 October 
     7847  1999 January 
     7884  2006 January 
     7826  1992 January 

是否有免費的文本轉換成一個簡單的(和Python的)方式一個標準的日期時間變量?例如:

df = 
      index    date 
      7838  2012-01-01 
      7790  2012-01-01 
      7853  2015-09-01 
      7889  2016-03-01 
      7928  2015-10-01 
      7847  1999-01-01 
      7884  2006-01-01 
      7826  1992-01-01 

回答

2

使用pd.to_datetime()將文本轉換爲日期類型。您可以從list中收集適當的日期類型。

df['date'] = pd.to_datetime(df['date'], format='%Y %B') 
2

to_datetime處理這個罰款沒有任何具體的格式說明:

In [83]: 
pd.to_datetime(df['date']) 

Out[83]: 
0 2012-01-01 
1 2012-01-01 
2 2015-09-01 
3 2016-03-01 
4 2015-10-01 
5 1999-01-01 
6 2006-01-01 
7 1992-01-01 
Name: date, dtype: datetime64[ns]