我有這樣的字符串,它表示一個title
標籤:認識標題標籤使用正則表達式
$fp = '<title>This is my title</title>';
我承認上面的標題使用下面的正則表達式字符串:
$res = preg_match("/<title>(.*)<\/title>/siU", $fp, $title_matches);
的問題在於某些標題具有以下某些參數:
<title itemprop="name">This is my title</title>
因此,正則表達式無法處理這種類型的標題,那麼如何更新我的正則表達式來識別兩個標題?
不要使用正則表達式來解析HTML,使用HTML解析器,東西像DOMDocument –
http://htmlparsing.com/regexes.html給出了更多的例子,你爲什麼不想用正則表達式來做到這一點。 –