解析網頁時,我的解析器停止由於無效的DOM結構。我想通過替換某個節點來修復它。preg_replace如果條件匹配
我發現有一個額外的</div>
導致解析器停止。
我需要編寫一個正則表達式,其將檢查: 如果隨後是</div>
[即任何</div>
沒有起始<div>
之間的標記。它將檢查<div
,因爲該標籤可能有id或class to follow],那麼最後的</div>
將被替換爲<div></div>
。
即,如果</div>
後面跟着</div>
,則最後一個將被替換爲<div></div>
。
在此先感謝。
例如: <div> <img src="/lexus-share/images/spacer.gif" width="2" height="15" border="0" alt=""> </div> <a href="http://www.somedomain.com"><img src="/pub-share/images.jpg"></a> </div>
你可以A:提供一些代碼與你的嘗試和B:澄清你到底想要什麼? – christopher 2013-02-26 13:30:09
也許你可以編輯它到你的問題:) – christopher 2013-02-26 13:35:46
所以你想要檢查每個'