2014-02-20 83 views
0

我一直在嘗試一段時間,但從來沒有真正理解正則表達式。我如何分割這個字符串,以便獲得域的年齡?謝謝。PHP拆分字符串與正則表達式

<a target=_blank title='View how the website looked at this Age' href=website-history.php?archiveCreationTime=2013050316413&domain=domain.net>0 years 9 months old</a> 

順便說一句,該代碼是一個HTML源的一部分。

對不起,可能是菜鳥問題。但我從來沒有時間學習正則表達式。我嘗試了爆炸,但我沒有讓它達到年齡。

+2

使用DOM解析器更適合此任務。我相信一個好的PHP是[SimpleHTMLDOM](http://simplehtmldom.sourceforge.net/) –

+0

謝謝你,請看看它 – Anders

回答

3

You shouldn't use regular expressions for parsing HTML。您應該使用爲此設計的工具,如DomDocument。這裏有一個簡單的例子:

<?php 
$string = "<a target=_blank title='View how the website looked at this Age' href=website-history.php?archiveCreationTime=2013050316413&domain=domain.net>0 years 9 months old</a>"; 
$dom = new DOMDocument(); 
@$dom->loadHTML($string); 
$anchor = $dom->getElementsByTagName('a')->item(0); 
echo $anchor->nodeValue; 

See it in action

0

您可以使用phpQuery做到這一點。如果你需要一個實際的例子,你可以閱讀scrape anchor tags。這裏有一些相關的代碼來向你展示如何獲取錨點標籤並提取錨點節點的內部文本。

相關問題