我有可能包含像這樣的鏈接的一些文本的模式:解析鏈接文本
<a rel="nofollow" target="_blank" href="http://loremipsum.net/">http://loremipsum.net/</a>
Lorem ipsum dolor sit amet, consectetuer adipiscing elit, <a rel="nofollow" target="_blank" href="http://loremipsum.net/">http://loremipsum.net/</a> sed diam nonummy nibh euismod tincidunt ut laoreet dolore magna aliquam erat volutpat.
我想找到這個文本中的鏈接(a
標籤),什麼是對的正則表達式模式?
這種模式不起作用:
const string UrlPattern = @"(http|ftp|https):\/\/[\w\-_]+(\.[\w\-_]+)+([\w\-\.,@?^=%&:/~\+#]*[\w\-\@?^=%&/~\+#])?";
var urlMatches = Regex.Matches(text, UrlPattern);
感謝
一個正則表達式可以解析任何和所有''標籤,這對黑盒子來說是一個巨大的難以維繫的怪物。那是你想要的嗎? – Jon
您會考慮使用另一種解決方案,而不是正則表達式,例如HtmlAgilityPack?如果是這樣,你可以在以後避免很多痛苦 – samy
這是一個只包含'a'標籤的文本。而不是HTML – user3293835