我有一個網頁http://dps.kse.com.pk/ticker/inc_ticker_xml.php,我想從表格中的ticker中提取所有的span和anchor標記值。像這個LPCL,11.06等 我試過curl和php的dom文件。它不工作。但我試圖在其他網頁上的腳本,如google.com和yahoo.com它對其起作用,但不在此頁面上。用PHP刮臉網頁
$html = file_get_contents($url);
$dom = new DOMDocument;
@$dom->loadHTML($html);
$links = $dom->getElementsByTagName('a');
//var_dump($links);
foreach ($links as $link){
echo '<a href = "'.$link->getAttribute('href').'">' ;
echo $link->getAttribute('href'), '<br>';
此代碼適用於其他頁面上不在http://dps.kse.com.pk/ticker/inc_ticker_xml.php頁面上。有沒有辦法取消這個頁面
這是因爲該頁面使用JavaScript生成。你很可能必須刮javascript代碼... – 131