-2
我想要獲取HTML中子字符串的位置。最難的部分是html可能在子字符串內。正則表達式匹配html中的字符串
例如: 如果我想匹配2nd
,但在html中,它的編碼如下2<span class="super">nd</span>
。
注:它可以是任何字符串,而不僅僅是「第一」,「第二」,...
怎麼能匹配任何一種內嵌HTML應答器的一個要求嗎?
我想要獲取HTML中子字符串的位置。最難的部分是html可能在子字符串內。正則表達式匹配html中的字符串
例如: 如果我想匹配2nd
,但在html中,它的編碼如下2<span class="super">nd</span>
。
注:它可以是任何字符串,而不僅僅是「第一」,「第二」,...
怎麼能匹配任何一種內嵌HTML應答器的一個要求嗎?
我發現了一個簡單的解決方案:
sub = r'\b' + '(<span[^>]*>)?'.join(list(substring)) + r'\b'
所以: 2nd
轉化爲\b2(<span[^>]*>)?n(<span[^>]*>)?d\b
匹配哪個 2nd
和2<span class="super">nd</span>
你可以找一個正則表達式匹配,但取只有部分使用[capture groups](http://www.regular-expressions.info/brackets.html)。 – schroedingersKat