我需要獲取具有CLASS CLASSIFY的所有SPAN標記。在其中一種情況下,我正在使用的RegEx跳過第一個SPAN標籤。RegEx在C#中獲取具有特定類名的所有SPAN標記
正則表達式
<span [^>]*class=\"classify\"(.*?)</span>
C#代碼
Regex.Matches(content, "<span [^>]*class=\"classify\"(.*?)</span>", RegexOptions.Multiline)
內容:
<span categoryid="110" categorytext="(Sup ed (Inl))" class="classify" classifyid="3395349" quoteid="" quotetext="" selectedclassify="true" style="font-weight: bold; background-color: #ffa500">
<u>Objective/reason for interaction</u>
<br /> wtwt
<br />
<br /> <u>Summary</u><br /> As -16/08/15</span>
<br />
<br />
<u>Actions</u>
<br /> N
<br />
<br />
<u>Outcomes/reportables</u>
<br />
<span categorytext="(Nofrf of J Ced)" class="classify" quoteid="" quotetext="" selectedclassify="false" style="categoryid="13416"">1 full </span>
<br /> A Mag
<br />
<br />
<u>K</u>
<br /> As ab
<br />
鏈接到.NET正則表達式測試儀:
請指點,我在正則表達式的思念。
HTML **不是**常規語言。您不能使用常規語言解析器(即RegEx)來解析它。您需要使用專門設計的功能,例如[HTML Agility Pack](http://htmlagilitypack.codeplex.com/)。 – Enigmativity
已閱讀此答案:http://stackoverflow.com/a/1732454/259769 – Enigmativity
解析器已就位,因此我無法更改整個代碼以使用HTML Agility Pack。 – AaBa