我試圖刪除JavaScript中的過多結束標記以及之後的任何內容。JavaScript的正則表達式來移除不匹配的結束HTML標記?
這裏是一個可能的樣本:
<div class="dummy">
<div class="main">
<div></div>
<img src="a.jpg">
<br>
<img src="b.jpg />
<strong>
<span>text</span>
</strong>
</div>
</div>
***excessive tags below***
</div>
</div>
<div class="footer">
text
</div>
</body>
</html>
有關如何有效地做到這一點任何想法? 我想要提取的部分始終是一個div,但問題是它可能具有儘可能多的嵌套div,並且我不確定如何處理此方案。
如果可以在多個步驟中完成,或者回調也很好,只要它可以工作。
編輯 我的問題實際上比看起來容易。 樣本始終以我想要提取的div開始。 所以我需要的是找到匹配的結束標記,並過濾任何後續內容。 不關心任何其他標籤...
這是一個很好的答案:http://stackoverflow.com/a/1732454/135078 –
正則表達式是不是一個分析工具。 – Vallentin
準確地說,你想要移除的標籤是什麼?下面的標籤下面的所有內容都是評論?兩個不匹配的標籤保持頁腳div? –