我一直在試圖解決這些問題的最後兩個小時,但似乎我找不到任何解決方案。提取鏈接正則表達式c#
我需要從HTML
文件中提取鏈接。有100多個鏈接,但只有25個是有效的。
的有效鏈接都放在裏面
<td><a href=" (link) ">
首先,我有(現在仍然有)與逐字字符串中雙引號的問題。所以,我用「正常」的字符串替換逐字這樣我就可以使用\「爲」,但問題是,這Regex
我寫不工作
Match LinksTemp = Regex.Match(
htmlCode,
"<td><a href=\"(.*)\">",
RegexOptions.IgnoreCase);
我得到"<td><a href="http://www.google.com">
輸出,而不是http://www.google.com
任何人都知道如何解決這個問題,我該如何使用雙引號逐字字符串內(例如@「<>‘DAS’SA」)
是的,THX但爲什麼犯規,如果我寫的羣體它的工作[0] – Triple 2011-06-10 23:47:00
因爲組[0]記住所有的字符串是匹配的。組[1]在()之間剪切文本。如果你的正則表達式是:「」那麼在組中[1]將是「href」並且在組中[2]將是你的www adres – nirmus 2011-06-10 23:56:02
+1爲gppd解釋。 – corlettk 2011-06-11 00:13:43