2011-12-13 150 views
1

從字符串獲取html標記的最好和最乾淨的方法是什麼?從字符串獲取HTML標記

我有一個包含視頻的多個嵌入標記的html字符串。有可以在HTML字符串

任意數量的嵌入標籤的我想我可以做這樣的事情,但它不可能是最好的辦法:

string embedSrc = propertyText.Substring(propertyText.IndexOf("<embed"), (propertyText.IndexOf ("</embed") - propertyText.IndexOf("<embed") + 8)); 

回答

2

嘗試使用HtmlAgilityPack輕鬆地解析它。如果不是,你可以使用正則表達式

+0

謝謝,但項目放在我的手中運行.Net 2.0和HtmlAgilityPack需要3.5。 – Andy 2011-12-14 08:27:11

+0

@Andy,來自我發佈的鏈接:`此處發佈在CodePlex上的版本適用於.NET Framework 2.0。如果您需要舊版本,請轉到舊頁面或給我留言。 ` – 2011-12-14 08:44:31

1

我認爲你可以使用C#API。嘗試使用XmlDocument的LoadXml(字符串)方法。之後,只需使用對象操作從中提取內部標籤或文本即可。看看 XmlDocument from MSDN

1

塞巴斯蒂安有權利,找到一個圖書館和HtmlAgilityPack是一個不錯的選擇。如果你需要文檔結構,這真的是最好的選擇。

使用正則表達式解析通常被認爲是HTML的禁忌。這真的取決於你想要從輸入字符串中讀出什麼。我寫了一個lightweight xml/html parser using Regex只是爲了看到它完成。這可以爲您提供所需的正則表達式模式。