0
我成功使用cURL和HTTP從遠程服務器下載文件,但該文件包含所有HTML代碼。HOWTO使用cURL和HTTP從HTML/XML中提取特定文本
在cURL中是否有一個函數,以便我可以提取我想要的值?
例如,我得到:
...
<body>
Hello,Manu
</body>
...
但我只想Hello,Manu
。
由於提前,
馬努
我成功使用cURL和HTTP從遠程服務器下載文件,但該文件包含所有HTML代碼。HOWTO使用cURL和HTTP從HTML/XML中提取特定文本
在cURL中是否有一個函數,以便我可以提取我想要的值?
例如,我得到:
...
<body>
Hello,Manu
</body>
...
但我只想Hello,Manu
。
由於提前,
馬努
嘗試使用DOMDocument或任何其他的XML解析器。
$doc= new DOMDocument();
$doc->loadHTML($html_content); // result from curl
$xpath= new DOMXPath($doc);
echo $xpath->query('//body')->item(0)->nodeValue;
或者命令行,你可以使用
curl 'http://.................' | xpath '//body'
是否使用捲曲在命令行或在其他語言的庫 – Robb 2011-06-09 10:07:05