這是日期的一個很好的正則表達式...然而它無限期地掛在這一頁上我試過了......我想嘗試這個頁面(http://pleac.sourceforge.net/pleac_python/datesandtimes.html),因爲它確實有很多的日期,我想抓住他們所有人。我不明白爲什麼它不掛在其他頁面上時爲什麼會掛起...爲什麼我的正則表達式掛起和/或我如何清理它以使其更好/更高效?防止RegEx在大型火柴上掛起
Python代碼:
monthnames = "(?:Jan\w*|Feb\w*|Mar\w*|Apr\w*|May|Jun\w?|Jul\w?|Aug\w*|Sep\w*|Oct\w*|Nov(?:ember)?|Dec\w*)"
pattern1 = re.compile(r"(\d{1,4}[\/\\\-]+\d{1,2}[\/\\\-]+\d{2,4})")
pattern4 = re.compile(r"(?:[\d]*[\,\.\ \-]+)*%s(?:[\,\.\ \-]+[\d]+[stndrh]*)+[:\d]*[\ ]?(PM)?(AM)?([\ \-\+\d]{4,7}|[UTCESTGMT\ ]{2,4})*"%monthnames, re.I)
patterns = [pattern4, pattern1]
for pattern in patterns:
print re.findall(pattern, s)
BTW ...當我說我嘗試它反對這個網站..我想這對網頁源。
順便說一句......當我說我嘗試它反對這個網站..我想這對網頁源... – user233864 2009-12-18 19:17:58