我正在使用RegEx清理包含HTML的XML文件。正確匹配兩個單詞之間的正則表達式並獲取所有匹配結果

某些文件包含多個style -elements，我想將它們全部和中間的內容刪除。例如：

&lt;STYLE&gt; 
    group 1 
&lt;/STYLE&gt; 
    Random text here which shall not be removed. 
&lt;STYLE&gt; 
    group 2 
&lt;/STYLE&gt; 
    Some more random text here which shall not be removed. 
&lt;STYLE&gt; 
    group 3 
&lt;/STYLE&gt;

我使用下面的正則表達式與/ s參數

(&lt;STYLE&gt;).*(&lt;\/STYLE&gt;)

問題是，這個正則表達式匹配<style>（#1）和最後</style>之間的一切（#3 ）。

我想只匹配group,<style>和</style>元素。這如何實現？

來源

2017-05-08 Sha

您已接受的解決辦法，但一定要明白，只有將刪除第一個樣式和組，即。您不能使用它來設置第二個（使用當前格式） – grail

@grail - 使用/ sg標誌時，接受的解決方案實際上可以正確地執行工作。 – Sha

你可以嘗試使用?操作使得正則非貪婪：

(&lt;STYLE&gt;).*?(&lt;\/STYLE&gt;) 
       ^^^ use ? to tell the regex engine to stop at the first closing tag

演示在這裏：

Regex101

來源

2017-05-08 04:15:58

太簡單了！謝謝：） – Sha

正確匹配兩個單詞之間的正則表達式並獲取所有匹配結果

回答

Regex101

相關問題