2013-06-30 53 views
0

如何解析使用PHP的HTML文檔中類「mod」(.mod)的內容。使用PHP解析HTML文檔中所有HTML元素中的內容

如果有可能使用DOMDocument,那麼請告訴我如何使用DOMDocument。

我目前使用下列以獲得在<title>標籤(<title></title>

$this->document = new DOMDocument(); 
$title = $this->document->getElementsByTagName('title')->item(0)->nodeValue; 

但也有共享類不同元素類型的網頁上的其他元素「國防部」之間的內容(.mod),我怎樣才能得到這些元素的內容?

回答

0

你可以使用xpath

$path = new DOMXPath($this->document); 
$nodes = $path->query("//*[contains(concat(' ', normalize-space(@class), ' '), ' mod ')]"); 
+0

你能向我解釋第二條線做什麼?特別是'query(「」);'?從外觀上看,這會返回一個包含類mod的所有元素的數組。之後,我會使用'foreach(){}'來遍歷數組,但是如何從每個節點獲取內容?通過內容,我的意思是每個元素內部都有類.mod? – JayGatz

+0

@JayGatz我從一個我做過的項目中獲得了這個,但是我做了一些Google搜索以獲得實際的xpath,我甚至不能記得那裏發生的一半事情。嘗試在xpath教程中查找構造。你也不能只使用節點的'nodeValue'屬性來獲取它們的內容。 – Musa