的特定部分,我已經有了一個稱號的結構是這樣的:正則表達式 - 拿到冠軍
<title>WebsiteName | Page title | Slogan</title>
目前,在C#中我用這個,拿到冠軍了:
Regex.Match(pageSource,
@"\<title\b[^>]*\>\s*(?<Title>[\s\S]*?)\</title\>",
RegexOptions.IgnoreCase).Groups["Title"].Value;
但是,我想出去的只是網頁標題。
是,HTML你解析? – Anirudha 2013-05-08 17:46:55
你想要在你提供的標題中匹配什麼?只是'頁面標題'? – 2013-05-08 17:51:21
分解你的問題。使用DOM解析工具的som形式來解析html。請參閱下面的答案。然後在標題內容中使用正則表達式或簡單的字符串。 – Mithon 2013-05-08 18:00:27