下面的正則表達式來提取從頁面的URL鏈接:如何匹配「或「有」或」正則表達式中
LINK_REGEX = re.compile("<a [^>]*href=['\"]([^'\"]+)['\"][^>]*>")
問題1>如何表示下面的字符串?我錯配'「中和目的
<a href="http://www.yahoo.com'>
我曾嘗試以下語句,並沒有爲我工作。
>>> page = '<a href="http://www.yahoo.com\'>'
>>> page
'<a href="http://www.yahoo.com\'>'
>>> page = '<a href="http://www.yahoo.com''>'
>>> page
'<a href="http://www.yahoo.com>'
問題2>根據我的理解,通過設計,LINK_REGEX將匹配如何修改正則表達式,以便強制匹配'with'或'with'。
你可以通過使用兩個更簡單的正則表達式來簡化你的生活... – fge 2012-01-13 22:05:16
三重引號是你的朋友在這裏。嘗試:'page =「」「 2012-01-13 23:11:25
如果你使用xml解析器獲取信息,這可能不是問題 – ninMonkey 2012-10-16 15:56:49