2012-01-04 35 views
0

我有一些mht格式的文件。關於部分HTML,我用正則表達式替換。RegEx取代HTML評論更新停止

string reta = Regex.Replace(_file, @"\<![ \r\n\t]*(--([^\-]|[\r\n]|-[^\-])*--[ \r\n\t]*)\>", 
          String.Empty, RegexOptions.Singleline | RegexOptions.Multiline | 
          RegexOptions.IgnorePatternWhitespace); 

而對於某些文件這個替換永遠不會停止。
也許你可以在這個替換中看到錯誤。 我不添加此文件,因爲保存數據。

Thanx

PS。我嘗試選擇這部分。

ANSWER
我在測試數據集正在工作中更改了查詢REGEX。

<![ \r\n\t]*--.*?--[ \r\n\t]*> 
+0

「某些文件」?不,對不起,你必須提供一些資料。做一個最小的情況,也就是問題發生的最小文件。 – 2012-01-04 08:01:25

回答

1

當曾經有人張貼了有關正則表達式和HTML一個問題,我說看看這個答案第一:

RegEx match open tags except XHTML self-contained tags

您需要閱讀它。

+0

我沒有解析HTML,我只是從HTML文件中移除了我在正則表達式中做的這個操作的註釋。 – 2012-01-04 11:18:41