如何使用regrx解析HTML文件並刪除所有註釋掉的文本？

-2

我需要解析一個HTML文件並刪除所有行註釋掉。如何使用regrx解析HTML文件並刪除所有註釋掉的文本？

有人知道如何使用正則表達式在HTML文件中刪除之間的註釋嗎？該文件有多行。

我有大約1000個文件需要處理，我需要使用C＃。

來源

2012-05-17 Ping Guo

你需要通過這個代碼...你爲什麼不使用文本編輯器只刪除？ –

僅供參考，HTML中沒有行，不是你的意思。雖然行分隔符的存在使其在技術上成爲多行字符串，但這不會改變您處理它的方式。 –

更換

<!--.*?-->

用空字符串

而且，這樣的點相匹配的新行以及設置的選項。

在C＃這成爲

resultString = Regex.Replace(subjectString, "<!--.*?-->", "", RegexOptions.Singleline);

來源

2012-05-17 18:37:13 buckley

你可以用C＃編寫一個小程序，但你可以使用Actual Search＆Replace http://www.divlocsoft.com/#find%20and%20replace（shareware）或http：//www.funduc .com/search_replace.htm（商業）。最好的是Powergrep，但花費幾塊錢。 – buckley

我錯過了什麼嗎？ '（。）'替代的目的是什麼？你爲什麼不匹配評論，並用空字符串替換它們？ –

@Alan我讓它變得太複雜了，替代品可以被省略。我簡化了答案 – buckley

如何使用regrx解析HTML文件並刪除所有註釋掉的文本？

回答

相關問題