2011-06-09 44 views
0

我成功使用cURL和HTTP從遠程服務器下載文件,但該文件包含所有HTML代碼。HOWTO使用cURL和HTTP從HTML/XML中提取特定文本

在cURL中是否有一個函數,以便我可以提取我想要的值?

例如,我得到:

... 
    <body> 
    Hello,Manu 
    </body> 
    ... 

但我只想Hello,Manu

由於提前,

馬努

+0

是否使用捲曲在命令行或在其他語言的庫 – Robb 2011-06-09 10:07:05

回答

0

嘗試使用DOMDocument或任何其他的XML解析器。

$doc= new DOMDocument(); 
$doc->loadHTML($html_content); // result from curl 
$xpath= new DOMXPath($doc); 
echo $xpath->query('//body')->item(0)->nodeValue; 

或者命令行,你可以使用

curl 'http://.................' | xpath '//body' 
相關問題