我有一個網絡機器人從網站提取一些數據。問題在於html內容沒有線路剎車,所以匹配某些東西有點困難,所以我需要提取td標籤之間的所有內容。這裏有一個字符串例如:PHP正則表達式否定
<a class="a" href="javascript:ow(19623507)">**-**-**-***.cstel.net</a> (<b><font color="#3300cc">Used</font></b>)</td><td><a class="a" href="javascript:ow(19623507)">**-**-**-***.cstel.net</a> (<b><font color="#3300cc">Used</font></b>)</td>
我的正則表達式到目前爲止:
<a\s+class="a"\s+href="javascript:ow\((.*?)\)">.+</a>(?!<td>).+</td>
但我的正則表達式的整條生產線相匹配,而不是匹配的所有內容。有任何想法嗎?
的可能重複【如何分析和處理PHP程序HTML?(http://stackoverflow.com/questions/3577641/how-to-parse-and-process-html-with-php) – outis 2012-03-29 01:04:07