2011-09-27 51 views
-1

我在一個變量中返回html內容(頁面佈局),但想要刪除這些標記中的<script>blabla</script>標籤和內容。刪除<script></script>從C#返回的HTML塊#

我該怎麼做?

+3

http://stackoverflow.com/questions/1732348/regex-match-open-tags-except-xhtml-self- contained-tags – flq

+1

看起來社區中有人認爲這是不該嘗試的。 – David

+0

@flq這個問題並沒有問「我如何使用正則表達式來做這件事?」,你可以重新標記問題並回答它。 – Justin

回答

2

你真的需要解析HTML。

嘗試使用Html Agility Pack應該使這個非常簡單,例如:

HtmlDocument doc = new HtmlDocument(); 
doc.Load("HTMLPage1.htm"); 
foreach (var node in doc.DocumentNode.SelectNodes("//script")) 
{ 
    node.Remove(); 
} 
+0

順便說一句,解析HTML一般是一個相當冒險的命題。如果您正在使用遺留的Web應用程序(或者一個錯誤的應用程序),那麼您可能無法將Html恢復爲Html Agility Pack可以正確解析的格式。 – wllmsaccnt

相關問題