我真的可以使用一些幫助。我有以下兩行。正則表達式 - 分組?
<TD noWrap>Data: <B><SPAN class="TableBody clsBold">4</SPAN></B></TD>
<TD noWrap>Format: <B><SPAN class="TableBody clsBold">9</SPAN>/<SPAN class=TableBody> </SPAN></B></TD>
我需要獲取標籤之間(4和9分別)文本
我使用正則表達式如下聲明:
(\s)*(<B>)*<(?<SPAN>\w*)(?:.*)>(?:.*)</\k<SPAN>>
這個偉大的工程的第一線在:
Data: (\s)*(<B>)*<(?<SPAN>\w*)(?:.*)>(?:.*)</\k<SPAN>>
但不與
工作Format: (\s)*(<B>)*<(?<SPAN>\w*)(?:.*)>(?:.*)</\k<SPAN>>
,因爲它抓住我需要節後SPAN,所以我沒有得到的9組4
如何獲得我需要使用什麼不同的前綴相同的正則表達式行。
使用正則表達式解析HTML通常是一個壞主意。你有沒有考慮過諸如HTML解析器之類的替代品? –
http://stackoverflow.com/questions/1732348/regex-match-open-tags-except-xhtml-self-contained-tags/1732454#1732454。也就是說,你用什麼編程語言來驅動你的正則表達式?我們會推薦一個更好的選項來更可靠地解析HTML –