這是我的正則表達式與類獲取所有標籤:正則表達式來排除一些
preg_match_all('/<\s*\w*\s*class\s*=\s*"?\s*([\w\s%#\/\.;:_-]*)\s*"?.*?>/',file,$matches);
它帶班的所有標籤匹配像<a class="abc">
的問題是,如果任何標記包含類比以前額外屬性這個正則表達式無法得到它。
例如爲:<a id="fig_3_1" class="figure-contents">
我想忽略fig_3_1
任何想法將它排除在外<a class="figure-contents">
?
使用HTML解析器,而不是正則表達式。 – Phylogenesis