2016-02-13 44 views
0

我想刪除一個HTML標記的結尾和另一個HTML標記的開頭之間的文本。REGEX - 替換結束標記和開始標記之間的文本

頁面上的標籤在它們之間有不同的文本。當然,在頁面上刪除多個不同的塊也是如此。

</h1> 
Section: ab (1)<br>Updated: 2015-05-01<br><a href="file:///home/gareththomasnz/Desktop/VirtualBoxShare/merged.html#2_index">Index</a> 
<a href="file:///man/man2html">Return to Main Contents</a><hr> 

<p> 
<a name="2_lbAB">&nbsp;</a> 
</p><h2> 

必須刪除整個頁面中/ H1和H2標記之間的所有內容。

嘗試了幾件事,但不能得到它的工作 - 任何建議?

+1

當問題得到解答時,我們不會在這裏添加已解決的標題。您表示通過接受某人提供給您的答案或通過編寫自己的答案(在下面提供的空白處)並接受它作爲解決方案來解決問題。 –

回答

0

打開並使用一個不情願的量詞:

Search: (?s)(?<=</h1>).*?(?=<h2>) 
Replace: <blank> 

注意:我不熟悉powergrep,因此它可能使用「斜線分隔」正則表達式語法,因此:

/(?<=</h1>).*?(?=<h2>)/s 
相關問題