2012-05-17 43 views
-2

我需要解析一個HTML文件並刪除所有行註釋掉<!-- HTML註釋,該文件可能包含多個部分<!---->如何使用regrx解析HTML文件並刪除所有註釋掉的文本<!-- -->?

有人知道如何使用正則表達式在HTML文件中刪除<!---->之間的註釋嗎?該文件有多行。

我有大約1000個文件需要處理,我需要使用C#。

+0

你需要通過這個代碼...你爲什麼不使用文本編輯器只刪除? –

+0

僅供參考,HTML中沒有行,不是你的意思。雖然行分隔符的存在使其在技術上成爲多行字符串,但這不會改變您處理它的方式。 –

回答

4

更換

<!--.*?--> 

用空字符串

而且,這樣的點相匹配的新行以及設置的選項。

在C#這成爲

resultString = Regex.Replace(subjectString, "<!--.*?-->", "", RegexOptions.Singleline); 
+0

你可以用C#編寫一個小程序,但你可以使用Actual Search&Replace http://www.divlocsoft.com/#find%20and%20replace(shareware) 或http://www.funduc .com/search_replace.htm(商業)。最好的是Powergrep,但花費幾塊錢。 – buckley

+0

我錯過了什麼嗎? '(。)'替代的目的是什麼?你爲什麼不匹配評論,並用空字符串替換它們? –

+0

@Alan我讓它變得太複雜了,替代品可以被省略。我簡化了答案 – buckley

相關問題