我有一些字大文本超鏈接,我想知道的所有文字,它的超級鏈接URL假設我的文字是按如下:查找超鏈接文本和URL
LoremIpsum.Net是一個小而簡單這個靜態網站不需要使用generator即可爲您提供體面的大小通道。該網站還提供了文本的全部大寫版本,以及翻譯,以及這個着名的解釋。
現在我想存儲超鏈接的單詞,它的數組或哈希表中的URL,任何人可以建議我或提供一些示例代碼來做到這一點。
在此先感謝。
我有一些字大文本超鏈接,我想知道的所有文字,它的超級鏈接URL假設我的文字是按如下:查找超鏈接文本和URL
LoremIpsum.Net是一個小而簡單這個靜態網站不需要使用generator即可爲您提供體面的大小通道。該網站還提供了文本的全部大寫版本,以及翻譯,以及這個着名的解釋。
現在我想存儲超鏈接的單詞,它的數組或哈希表中的URL,任何人可以建議我或提供一些示例代碼來做到這一點。
在此先感謝。
見「計劃,與正則表達式[C#]刮痧」此頁上:http://www.dotnetperls.com/scraping-html
它主要的工作原理是regexing文本並收集比賽。
嘗試HTMLAgilityPackhttp://www.codeplex.com/htmlagilitypack
喜歡的東西
HtmlDocument doc = new HtmlDocument();
doc.Load("file.htm");
foreach(HtmlNode link in doc.DocumentElement.SelectNodes("//a[@href"])
{
HtmlAttribute att = link["href"];
// these are your hrefs!
}
你會失去你的心,如果你不使用正確的HTML解析器。
*文中有些詞是超鏈接*?它是如何完成的,我認爲文本並沒有鏈接它將控件作爲鏈接的鏈接(就像你錯過了鏈接[3]它現在不再是鏈接) – V4Vendetta
你需要解析html的'' - 標籤。 – VMAtm
我想查找所有超鏈接文本,如生成器和它的網址。 – Askiitians