2008-08-25 26 views
5

我需要過濾掉字符串中的錨標記。例如,過濾出字符串中的錨標記

Check out this site: <a href="http://www.stackoverflow.com">stackoverflow</a>

我需要能夠錨標記篩選出這樣的:

Check out this site: http://www.stackoverflow.com

該格式可能不是恆定的,無論是。錨標籤可能還有其他屬性。另外,字符串中可能有多個錨標記。在進入數據庫之前,我正在做vb.net中的過濾。

回答

8

這是一個簡單的正則表達式,應該可以工作。

Imports System.Text.RegularExpressions 

' .... 

Dim reg As New Regex("<a.*?href=(?:'|"")(.+?)(?:'|"").*?>.+?</a>") 
Dim input As String = "This is a link: <a href='http://www.stackoverflow.com'>Stackoverflow</a>" 
input = reg.Replace(input, "$1", RegexOptions.IgnoreCase)