我知道如何從外部網站拉動HTML內容並解析它,但問題是,我想提取的內容是由JavaScript函數生成的。從外部網站拉內容生成javascript
的代碼看起來是這樣的:
<div align="left">
<div id="divCotizaciones"></div>
<script type="text/javascript">
getCotizaciones("cotizaciones_busca.dat");
</script>
</div>
我想提取由該函數產生的所有的內容。 這是從那裏我試圖拉內容的網頁:http://www.bvl.com.pe/neg_rv_alfa.html#
我想這一點,但它不工作:
$html = new DOMDocument();
$html->loadHtmlFile('http://www.bvl.com.pe/neg_rv_alfa.html#');
$xpath = new DOMXPath($html);
$nodelist = $xpath->query('//*[@id="div"]/div[4]');
echo $output = $nodelist->item(0)->nodeValue;
// and this is the output I get: getCotizaciones("cotizaciones_busca.dat");
你將需要一個JavaScript引擎,如:[v8](http://www.php.net/manual/en/book.v8js.php)或[的SpiderMonkey](http://pecl.php.net/package/spidermonkey)。 –