正則表達式中除去連續的字符格式標記

我需要一個正則表達式匹配和替換連續的字符格式標籤封裝在簡單的DOM HTML解析器正則表達式中除去連續的字符格式標記

輸入整段的標籤：

<p><b><i>Lorem Ipsum Content</i></b></p>

預期輸出：Lorem Ipsum

在下面的例子中，正則表達式只能匹配並替換標籤，因爲這是包含整個段落標籤的唯一標籤

例如：輸入：Text some more text text inside 

輸出：Text some more text text inside 

感謝。

2017-03-28 Abdul

它會是這個樣子：

foreach($html->find('p') as $p) { 
    while(preg_match('/^<([^>]+)>(.*)<\/\1>$/', $p->innertext, $m)){ 
    $p->innertext = $m[2]; 
    } 
}

注意的是，在正則表達式的\1 HTML標記名稱從匹配第一捕獲組，可能不是必要的，但我爲獎金做了。

2017-03-29 00:33:25 pguardiario

非常感謝@pguardiario – Abdul

不是一個優雅，也許是部分靈魂。

而步驟3的正則表達式就是這樣。

<p>\s*(<i>)*\s*.*(<\/i>)\s*<\/p>

對於標籤，更換到等

2017-03-28 07:39:53

回答