2013-07-26 71 views
1

我試圖在專區內解析HTML文件和retreive所有內容解析HTML DIV ID包括在內的所有內容

$some_html = file_get_contents($html); 
$dom = new DOMDocument(); 
@$dom->loadHtml($some_html);//Strict error checking off  

$xpath = new DOMXPath($dom);  
$result = $xpath->query('//*[@id="IDX-detailsWrapper"]');  
if (!empty($result)) {  
    foreach ($result as $link) {var_dump($link->nodeValue); }} 

的HTML:

<div id="IDX-detailsWrapper"><div id=content><h1>test</h1></div></div> 

我希望能找回以下字符串

`<div id=content><h1>test</h1></div>` 

,而不是

`test` 

目前它只能檢索div中包含的文本而不是html。

雖然我不確定這樣做的確切做法!

由於JT

回答

3

我最終使用從http://sourceforge.net/projects/simplehtmldom/files/

庫和工作原理是

include('simple_html_dom.php');   
$html = file_get_html($html); 
foreach($html->find('div#IDX-detailsWrapper') as $e) 
echo $e->innertext . '<br>'; 

希望這可以幫助別人:)

示例代碼