2009-05-19 103 views
21

我有一個由RFC 2822指定格式的日期 - 比如Fri, 15 May 2009 17:58:28 +0000,作爲一個字符串。是否有一種快速和/或標準的方式將它作爲Python 2.5中的datetime對象?我試圖產生一個strptime格式的字符串,但+0000時區說明符混淆瞭解析器。如何將RFC 2822日期/時間解析爲Python日期時間?

回答

27

問題是parsedate會忽略偏移量。

而是執行此操作:

from email.utils import parsedate_tz 
print parsedate_tz('Fri, 15 May 2009 17:58:28 +0700') 
8

email.util中有一個解析函數。 它解析所有有效的RFC 2822日期和一些特殊情況。

12
from email.utils import parsedate 
print parsedate('Fri, 15 May 2009 17:58:28 +0000') 

Documentation

+0

+1我不知道這個功能,真的很整齊。 – 2009-05-19 21:14:48

7

我想闡述一下以前的答案。 email.utils.parsedateemail.utils.parsedate_tz都返回元組,因爲OP需要datetime.datetime對象,我添加這些例子的完整性:

from email.utils import parsedate 
from datetime import datetime 
import time 

t = parsedate('Sun, 14 Jul 2013 20:14:30 -0000') 
d1 = datetime.fromtimestamp(time.mktime(t)) 

或者:

d2 = datetime.datetime(*t[:6]) 

注意d1d2都是天真datetime對象,沒有存儲時區信息。如果您需要了解日期時間對象,請檢查tzinfodatetime() arg。

另外,您可以使用dateutil模塊

4

它看起來像Python 3.3前進在email.utils的新方法parsedate_to_datetime這需要中間步驟的護理:

email.utils。 parsedate_to_datetime(日期)

format_datetime的倒數()。執行與parsedate()相同的功能,但在 成功返回日期時間。如果輸入日期的時區爲-0000, ,則日期時間將是天真的日期時間,並且如果日期符合 與RFC的關係,則它將表示UTC的時間,但不指示 消息的實際源時區日期來自。如果 輸入日期有任何其他有效的時區偏移量,日期時間將是 一個知道的日期時間與相應的時區tzinfo。

版本3.3中的新功能。

http://python.readthedocs.org/en/latest/library/email.util.html#email.utils.parsedate_to_datetime

1

email.utils.parsedate_tz(date)是使用功能。以下是一些變化。

電子郵件日期/時間字符串(RFC 5322RFC 2822RFC 1123)爲Unix時間戳浮法秒:

import email.utils 
import calendar 
def email_time_to_timestamp(s): 
    tt = email.utils.parsedate_tz(s) 
    if tt is None: return None 
    return calendar.timegm(tt) - tt[9] 

import time 
print(time.strftime("%Y-%m-%dT%H:%M:%SZ", time.gmtime(email_time_to_timestamp("Wed, 04 Jan 2017 09:55:45 -0800")))) 
# 2017-01-04T17:55:45Z 

確保您不使用mktime(它解釋time_struct在您的計算機的本地時間,不是UTC);改爲使用timegmmktime_tz(但要注意下一段中的mktime_tz)。

如果你確信你有Python版本2.7.4,3.2.4,3.3或更高版本,那麼你可以使用email.utils.mktime_tz(tt)而不是calendar.timegm(tt) - tt[9]。在此之前,mktime_tz在本地時區的秋季夏令時轉換(bug 14653)期間調用時會給出錯誤的時間。

感謝@ j-f-sebastian爲caveats about mktime and mktime_tz

電子郵件日期/時間字符串(RFC 5322RFC 2822RFC 1123)到「知道」 datetime有關python 3.3:

關於Python 3.3以上,使用email.utils.parsedate_to_datetime,其與原始區域返回意識到datetime偏移:

import email.utils 
email.utils.parsedate_to_datetime(s) 

print(email.utils.parsedate_to_datetime("Wed, 04 Jan 2017 09:55:45 -0800").isoformat()) 
# 2017-01-04T09:55:45-08:00 

警告:如果時間落在閏秒上,這將拋出ValueError例如email.utils.parsedate_to_datetime("Sat, 31 Dec 2016 15:59:60 -0800")

電子郵件日期/時間字符串(RFC 5322RFC 2822RFC 1123),以「知道」 datetime在UTC區:

這只是轉換成時間戳,然後以UTC datetime

import email.utils 
import calendar 
import datetime 
def email_time_to_utc_datetime(s): 
    tt = email.utils.parsedate_tz(s) 
    if tt is None: return None 
    timestamp = calendar.timegm(tt) - tt[9] 
    return datetime.datetime.utcfromtimestamp(timestamp) 

print(email_time_to_utc_datetime("Wed, 04 Jan 2017 09:55:45 -0800").isoformat()) 
# 2017-01-04T17:55:45 

電子郵件日期/時間字符串(RFC 5322,RFC 2822,RFC 1123)到python「知道」datetime與原始偏移量:

之前到Python 3.2,Python中沒有附帶tzinfo實現,所以這裏使用dateutil.tz.tzoffsetpip install dateutil)的例子:

import email.utils 
import datetime 
import dateutil.tz 
def email_time_to_datetime(s): 
    tt = email.utils.parsedate_tz(s) 
    if tt is None: return None 
    tz = dateutil.tz.tzoffset("UTC%+02d%02d"%(tt[9]//60//60, tt[9]//60%60), tt[9]) 
    return datetime.datetime(*tt[:5]+(min(tt[5], 59),), tzinfo=tz) 

print(email_time_to_datetime("Wed, 04 Jan 2017 09:55:45 -0800").isoformat()) 
# 2017-01-04T09:55:45-08:00 

如果您正在使用python 3.2,你可以使用內置的tzinfo實施datetime.timezonetz = datetime.timezone(datetime.timedelta(seconds=tt[9])),而不是第三方dateutil.tz.tzoffset

再次感謝@ j-f-sebastian for note on clamping the leap second