我想從下面一個HTML字符串去掉所有錨標籤之間的鏈接和文本:正則表達式剝離錨標記之間的一切
string LINK_TAG_PATTERN = "/<a\b[^>]*>(.*?)<\\/a>";
htmltext = Regex.Replace(htmltext, LINK_TAG_PATTERN, string.Empty);
這不是工作人有想法,爲什麼?
非常感謝,
編輯:正則表達式是從該鏈接Extract text and links from HTML using Regular Expressions
如果您嘗試使用RegEx處理HTML/XML,請注意它不起作用,因爲我相信HTML/XML是上下文無關語言,但不是正則語言。 – 2010-01-19 13:20:08