2013-04-30 79 views
0

我需要從一個HTML頁面刪除以下字符串內容正則表達式替換HTML頁面中內容

<a rel="nofollow" href="http://feeds.wordpress.com/1.0/gocomments/terminaldeembarque.wordpress.com/1847/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/comments/terminaldeembarque.wordpress.com/2044/"></a> 

注意只有數字「2044」和「1847年」是變量,我能做到這一點與一個正則表達式? 任何人都可以幫助我嗎?

謝謝。

回答

1

使用這個表達式:

"a rel=\"nofollow\" href=\"http://feeds.wordpress.com/1.0/gocomments/terminaldeembarque.wordpress.com/[0-9]*/\"><img alt=\"\" border=\"0\" src=\"http://feeds.wordpress.com/1.0/comments/terminaldeembarque.wordpress.com/[0-9]*/\"></a>" 
+0

感謝的人!!!!有效!!! – Greg 2013-04-30 02:06:02

1

這取決於你是否要刪除所有的錨標籤或只是特定。 你可以把這個整個字符串爲正則表達式(不要忘記什麼都逃不過)代替作爲數字「2044」和「1847年」使用\ d {0,}或\ d +,像這樣:

...wordpress.com/\d+/ 

...wordpress.com/\d{0,}/ 

變化{0,}到的數字的最小所需量的零相匹配。 但請注意,這個正則表達式非常具體,如果一個字符與您提供的字符不同,就會中斷。例如,如果rel屬性被省略或html結構中的任何其他更改。

最後的正則表達式:

<a rel="nofollow" href="http://feeds\.wordpress\.com/1\.0/gocomments/terminaldeembarque\.wordpress\.com/\d{0,}/"><img alt="" border="0" src="http://feeds\.wordpress\.com/1\.0/comments/terminaldeembarque\.wordpress\.com/\d{0,}/"></a>