我需要提取字符串內的url。我需要提取字符串內的url
在我的情況下,html文本是在數據庫中,當我得到的文本和需要找到文本中的所有網址,並插入到另一個表,你可以給我一個方法來找到SQL或C#中的網址。
我需要提取字符串內的url。我需要提取字符串內的url
在我的情況下,html文本是在數據庫中,當我得到的文本和需要找到文本中的所有網址,並插入到另一個表,你可以給我一個方法來找到SQL或C#中的網址。
這是reqular表達找到網址,文本
Regex regx = new Regex("http://([\\w+?\\.\\w+])+([a-zA-Z0-9\\~\\!\\@\\#\\$\\%\\^\\&\\*\\(\\)_\\-\\=\\+\\\\\\/\\?\\.\\:\\;\\'\\,]*)?", RegexOptions.IgnoreCase);
MatchCollection mactches = regx.Matches(txt);
'https''ftp'? – I4V
其中一個可能的方式來做到這一點是通過使用正則表達式。首先選擇是從數據庫中提取HTML,然後使用正則表達式直接查找鏈接。第二個選項是先定位鏈接標記,然後從中提取網址(再次使用正則表達式)。
在這裏你可以找到有關如何使用C#正則表達式的信息: http://msdn.microsoft.com/en-us/library/system.text.regularexpressions.regex.aspx
在另一方面,書寫正確的正則表達式可能不那麼容易(這取決於URL有多複雜)但你應該看看這個問題:regular expression for url
另外,在這裏你可以找到很多有關正則表達式的信息(請記住,有一些像RegexBuddy這樣的應用程序,它可以幫助你很多來測試你的正則表達式):http://www.regular-expressions.info/
您是否嘗試過使用正則表達式? –
http://stackoverflow.com/questions/4750015/regular-expression-to-find-urls-within-a-string –