2013-08-23 50 views
0

我需要提取字符串內的url。我需要提取字符串內的url

在我的情況下,html文本是在數據庫中,當我得到的文本和需要找到文本中的所有網址,並插入到另一個表,你可以給我一個方法來找到SQL或C#中的網址。

+0

您是否嘗試過使用正則表達式? –

+0

http://stackoverflow.com/questions/4750015/regular-expression-to-find-urls-within-a-string –

回答

1

這是reqular表達找到網址,文本

Regex regx = new Regex("http://([\\w+?\\.\\w+])+([a-zA-Z0-9\\~\\!\\@\\#\\$\\%\\^\\&\\*\\(\\)_\\-\\=\\+\\\\\\/\\?\\.\\:\\;\\'\\,]*)?", RegexOptions.IgnoreCase); 

MatchCollection mactches = regx.Matches(txt); 
+1

'https''ftp'? – I4V

0

其中一個可能的方式來做到這一點是通過使用正則表達式。首先選擇是從數據庫中提取HTML,然後使用正則表達式直接查找鏈接。第二個選項是先定位鏈接標記,然後從中提取網址(再次使用正則表達式)。

在這裏你可以找到有關如何使用C#正則表達式的信息: http://msdn.microsoft.com/en-us/library/system.text.regularexpressions.regex.aspx

在另一方面,書寫正確的正則表達式可能不那麼容易(這取決於URL有多複雜)但你應該看看這個問題:regular expression for url

另外,在這裏你可以找到很多有關正則表達式的信息(請記住,有一些像RegexBuddy這樣的應用程序,它可以幫助你很多來測試你的正則表達式):http://www.regular-expressions.info/