Pre scriptum:我完全好奇,並且意識到其他完美合適的解決方案,它位於正則表達式域之外。匹配嵌套標籤
如何從開始標記匹配,直到結束標記可能嵌套,也許相同的標記。所以說,我在HTML文件中已經給:
<div class="nice">
<a href="http://www.google.com">Hello</a>
<div>World</div>
</div>
比方說我要評論了這一點通過正則表達式替換。人們可以做一個簡單的
/(<div\sclass=\"nice\">(.*)</div>)/
但是,當然比賽的那會,直到最後結束的div標籤,渲染代碼犯規,如果漂亮的DIV嵌入另一個DIV中。使分隔符非貪婪會使代碼犯規更多,匹配直到VERY FIRST結束div標記。
那麼有什麼想法?我經常想到這一點,我從來沒有找到解決方案,這在正則表達式中是不可能的,還是隻是我忘記了一些簡單的東西?是不是有某種「回顧」機制?
你會使用哪種語言?如果您逐行讀取數據並將數據存儲在某個數據結構中,那肯定是可行的。 – 2010-01-05 21:51:09