我已經編寫了下面的代碼來解析來自給定頁面的超鏈接。從網頁解析超鏈接
WebClient web = new WebClient();
string html = web.DownloadString("http://www.msdn.com");
string[] separators = new string[] { "<a ", ">" };
List<string> hyperlinks= html.Split(separators, StringSplitOptions.None).Select(s =>
{
if (s.Contains("href"))
return s;
else
return null;
}).ToList();
儘管字符串拆分仍然需要調整以完美地返回url。我的問題是有一些數據結構,就是XmlReader的行,它可以有效地讀取HTML字符串。
任何有關改進上述代碼的建議也會有所幫助。
謝謝你的時間。
喜,只是想知道:你有沒有發現任何有用的答案,你的問題? – Thousand
@千你的答案是正確的。謝謝。 – Abhijeet