2010-02-20 80 views

回答

1

您可以使用正則表達式來剝離HTML標籤,如:

string html = "Your html string"; 
string x = Regex.Replace(html,@"<(.|\n)*?>", string.Empty); 
+0

在這裏,我可以得到字符串不包括html標籤從其中的html標籤的字符串? – Harikrishna

+0

和正則表達式是什麼? – Harikrishna

+0

@thedugas好吧...這是System.Text.RegularExpression.It工作..謝謝... – Harikrishna

2

正則表達式是不理想的HTML。正則表達式用於常規文本,而不是HTML。

使用HTML解析器庫,例如免費的開放源代碼HTML Agility Pack。它捆綁了一個HTML-to-Text converter sample

+0

@Judah - 感謝張貼,看起來很甜 - 不能等待檢查出來。 – dugas

+0

雖然是真的,但一般來說,簡單地剝離標籤(「以'開頭並以'>'」結尾的東西)非常適合於正則表達式。 –

+1

http://www.codinghorror.com/blog/2009/11/parsing-html-the-cthulhu-way.html –

相關問題