2017-04-19 55 views
-2

我想要獲取HTML中子字符串的位置。最難的部分是html可能在子字符串內。正則表達式匹配html中的字符串

例如: 如果我想匹配2nd,但在html中,它的編碼如下2<span class="super">nd</span>

注:它可以是任何字符串,而不僅僅是「第一」,「第二」,...

怎麼能匹配任何一種內嵌HTML應答器的一個要求嗎?

+0

你可以找一個正則表達式匹配,但取只有部分使用[capture groups](http://www.regular-expressions.info/brackets.html)。 – schroedingersKat

回答

0

我發現了一個簡單的解決方案:

sub = r'\b' + '(<span[^>]*>)?'.join(list(substring)) + r'\b'

所以: 2nd轉化爲\b2(<span[^>]*>)?n(<span[^>]*>)?d\b

匹配哪個 2nd2<span class="super">nd</span>

相關問題