我有一個HTML源代碼作爲輸入,並想知道CMS的網站是由 許多CMS留下自己的姓名在meta標籤是這樣的:正則表達式匹配和子串在一個?
<meta name="Generator" content="MY CMS" />
我能得到這樣的結果:
Match match = Regex.Match(html, ".*(?i)meta.*generator.*");
match = Regex.Match(match.ToString(), "content.*\".*\"");
match = Regex.Match(match.ToString(), "\".*\"");
給我「我的CMS」
但是有什麼辦法縮短到一個Regex.Match?
請注意,meta標記可能是這樣的:
<meta content="MY CMS" name="Generator" />
感謝和問候
或者你可以使用了合適的工具:http://htmlagilitypack.codeplex.com/ – TrueWill
避免'regex' ...使用HTML解析器像htmlagilitypack – Anirudha