我需要從一組HTML文件中找到某個塊並將它們全部刪除。這些文件真的被黑了HTML,所以我不想用HtmlAgility包解析它,我想用一個簡單的正則表達式。在html中匹配一個正則表達式,忽略空格和引號
HTML的部分將總是看起來像這樣:
<CENTER>some constant text <img src=image.jpg> more constant text:
variable section of text</CENTER>
上述所有可以是上,下殼體的任意組合,並且發現它是IMG SRC = image.jpg的和不IMG SRC =「image.jpg」...並且在常數字符之間可以有任意數量的空白字符。
這裏有一些例子:
<CENTER>This page has been visited
<IMG SRC=http://place.com/image.gif ALT="alt text">times since 10th July 2007
</CENTER>
或
<center>This page has been visited
<IMG src="http://place.com/image.gif" Alt="Alt Text">
times since 1st October 2005</center>
你認爲將與此模式匹配的好方法?
你看了我的腦海:)謝謝。 – 2009-03-04 01:36:16