我需要一些解析html內容的建議,需要在div內提取標籤< \ a>的id,並將其存儲到變量特定的變量中。我試圖爲此做一個正則表達式,但它在所有div中獲取標記的id。我需要存儲標籤< \ a>的ID,它只在特定div內。在perl中形成正則表達式需要幫助
HTML內容是
<div class="m_categories" id="part_one">
<ul>
<li>-
<a href="#" class="sel_cat " id="sel_cat_10018">aaa</a>
</li>
<li>-
<a href="#" class="sel_cat " id="sel_cat_10007">bbb</a>
</li>
.
.
.
</div>
<div class="m_categories hidden" id="part_two">
<ul>
<li>-
<a href="#" class="sel_cat " id="sel_cat_10016">ccc</a>
</li>
<li>-
<a href="#" class="sel_cat " id="sel_cat_10011">ddd</a>
</li>
<li>-
<a href="#" class="sel_cat " id="sel_cat_10025">eee</a>
</li>
.
.
</div>
需要一些建議,在此先感謝
更新: 我已經使用
規則運算($含量=〜米/ sel_cat「 id =「([^ <] *?)」/ is){}
while($ content =〜m/sel_cat「id =」([^ <] *?)「/ igs){}
我認爲一個合適的html解析器會更容易。如果你仍然想使用正則表達式...發佈正在嘗試的正則表達式。 – Jerry
Obligatory:[你不能用正則表達式解析\ [X \] HTML](http://stackoverflow.com/questions/1732348/regex-match-open-tags-except-xhtml-self-contained-tags)。 「即使Jon Skeet也不能使用正則表達式解析HTML,每當你試圖用正則表達式解析HTML時,邪惡的孩子會哭泣處女血,俄羅斯黑客就會用你的webapp。」 – DVK