考慮下面的HTML裏面......C#正則表達式搶到2個信息從每個HTML元素的TR - 位於不同的TD元素
<table>
<tr>
<td><strong>Name 1</strong></td>
<td>Info and ignore <a href="/gohere"/>this</a></td>
<td><a href="MySpecialAction?field=&list=10000">Edit</a></td>
</tr>
<tr>
<td><strong>Name 2</strong></td>
<td>Info and ignore <a href="/gohere"/>this</a></td>
<td><a href="MySpecialAction?field=&list=10001">Edit</a></td>
</tr>
</table>
是否可以寫一個C#正則表達式那會搶'name'(與td/strong一起找到)和'listid'(在包含MySpecialAction的href中找到)?
我抓住了它的名字(可能效率不高,但我希望我可以寫一個表達式,如上所述,會有2個匹配,每個匹配將有兩個組(命名爲'name'和'id 「)。
<strong\b[^>]*>(.*?)<\/strong>
Match1.name=Name 1
Match1.id=10000
Match2.name=Name 2
Match2.id=10001
在此先感謝。
爲什麼不使用html解析器? – spender 2014-11-25 08:54:01
http://stackoverflow.com/questions/1732348/regex-match-open-tags-except-xhtml-self-contained-tags。不要使用正則表達式來解析html! – mybirthname 2014-11-25 08:55:14
@spender請指教一下'html parser'是什麼?我並不是想要解析整個HTML體,而是從html中抽取幾個字符串。我把html看作是一個簡單的'大字符串'和Regex作爲匹配'string'部分的工具。很明顯,我在這些領域的知識水平偏低。很高興使用最簡單的方法(並且非常簡單地閱讀,我從來沒有花時間學習正則表達式語法)是正確的工具。 – Terry 2014-11-25 15:10:49