我希望能夠讀取一個字符串並返回出現在其中的第一個日期。有沒有可以使用的模塊?我試圖爲所有可能的日期格式編寫正則表達式,但它很長。有沒有更好的方法來做到這一點?Python - 在字符串中查找日期
,你也可以嘗試dateutil.parser ... 沒有嘗試過自己,但聽到一些很好的意見。 python-dateutil
import dateutil.parser
from itertools import chain
import re
# Add more strings that confuse the parser in the list
UNINTERESTING = set(chain(dateutil.parser.parserinfo.JUMP,
def _get_date(tokens):
for end in xrange(len(tokens), 0, -1):
region = tokens[:end]
if all(token.isspace() or token in UNINTERESTING
for token in region):
text = ''.join(region)
date = dateutil.parser.parse(text)
return end, date
except ValueError:
def find_dates(text, max_tokens=50, allow_overlapping=False):
tokens = filter(None, re.split(r'(\S+|\W+)', text))
skip_dates_ending_before = 0
for start in xrange(len(tokens)):
region = tokens[start:start + max_tokens]
result = _get_date(region)
if result is not None:
end, date = result
if allow_overlapping or end > skip_dates_ending_before:
skip_dates_ending_before = end
yield date
test = """Adelaide was born in Finchley, North London on 12 May 1999. She was a
child during the Daleks' abduction and invasion of Earth in 2009.
On 1st July 2058, Bowie Base One became the first Human colony on Mars. It
was commanded by Captain Adelaide Brooke, and initially seemed to prove that
it was possible for Humans to live long term on Mars."""
print "With no overlapping:"
for date in find_dates(test, allow_overlapping=False):
print date
print "With overlapping:"
for date in find_dates(test, allow_overlapping=True):
print date
With no overlapping:
1999-05-12 00:00:00
2009-07-01 20:58:00
With overlapping:
1999-05-12 00:00:00
1999-05-12 00:00:00
1999-05-12 00:00:00
1999-05-12 00:00:00
1999-05-03 00:00:00
1999-05-03 00:00:00
1999-07-03 00:00:00
1999-07-03 00:00:00
2009-07-01 20:58:00
2009-07-01 20:58:00
2058-07-01 00:00:00
2058-07-01 00:00:00
2058-07-01 00:00:00
2058-07-01 00:00:00
2058-07-03 00:00:00
2058-07-03 00:00:00
2058-07-03 00:00:00
2058-07-03 00:00:00
- 「1999年5月12日」 進行解析,以1999-05-12 00:00:00
- 「1999年5月」 進行解析,以1999- 05-03 00:00:00(因爲今天是本月的第3天)
但是,如果不允許重疊,「2009年7月1日」將被解析爲2009-07-01 20:58:00並且沒有試圖解析日期之後的日期。
+1爲詳細的解決方案 –
好。一旦我刪除了Except子句中的「ValueError」限制,爲我工作。似乎還有其他錯誤產生(例如NoneType)。 – Soferio
我有一些(儘管蹩腳)example code on my blog,旨在尋找在美國的格式和德國一樣日期格式表達式。它可能不是你所需要的,但它可以很好地調整。
date_object = datetime.strptime('三月-1-05 ','%B-%d-%y')
print date_object.strftime(「%B%d,%Y」)
- 1. Python - 從字符串中查找日期
- 2. 在python中查找字符串中較舊的日期3
- 3. 如何檢查python中的日期字符串的日期?
- 4. 在字符串中找到日期
- 5. 在python中比較日期字符串
- 6. Python - 檢查日期字符串中的字符
- 7. 在字符串中反向查找Python
- 8. 在Python中查找字符串
- 9. Python:在字符串中查找「=」
- 10. Python在字符串中查找模式
- 11. C#:查找日期括在括號中的字符串
- 12. Ruby:在字符串數組中查找日期
- 13. 如何在PHP中查找日期字符串?
- 14. python查找字符串中的子串
- 15. 解析字符串日期在python
- 16. 顯示從字符串日期在Python
- 17. 查找字符串的Python
- 18. Python字符串查找
- 19. 在字符串中查找字符串
- 20. 在字符串中查找字符串
- 21. Python:在字符串中查找字符串
- 22. 在MySQL查詢中將日期字符串轉換爲日期
- 23. 從json日期字符串中提取日期到字符串
- 24. 在Python中查找字符串中的字符數
- 25. 轉換日期爲JSON日期字符串在python
- 26. 日期從日期字符串在SunOS
- 27. Excel-VBA:從字符串中查找和替換日期格式
- 28. 使用正則表達式查找字符串中的日期
- 29. 查找字符串中是否包含日期和時間
- 30. 用於查找字符串中日期的正則表達式
什麼是文本的格式,是否有格式,是純文本,可能會出現哪些可能的日期組合。如果你正在尋找一切,你會怎麼處理10/20/2011與20/10/2011?什麼10/20/99主場迎戰20/10/99主場迎戰99/10/20? –
http://labix.org/python-dateutil可能會有用。 –
什麼... downvotes?這是一個很好的,經常遇到問題的問題。 – andychase