我無法從網頁獲取內容提取內部文本, 其實我想從取div名稱displaybody
從特定的div
所有內部文本,但我的代碼似乎並不工作,它爲獲取頁面的所有內容,而不是取出由displaybody格和後4頁成功抓取我得到一個錯誤的內容,
Fatal error: Maximum execution time of 30 seconds exceeded in E:\Installations\xampp\htdocs\wp\simple_html_dom.php on line 127
這裏是腳本代碼,
我想我的劇本打開在代碼中提到的URL裏面所有的子頁面(/ TXT /任意數量),並獲取其特定的div內容(displaybody)
<?php
$request_url ='http://www.zedge.net/txts/4519/200-3-1/';
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, $request_url);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);
$result = curl_exec($ch);
$regex='/href=\"\/txt\/[0-9].*/';
preg_match_all($regex,$result,$parts);
foreach($parts[0] as $link){
$url = 'http://zedge.net' . str_replace ("href=\"",'',$link);
echo file_get_html($url)->plaintext;
echo "<br /><br/ ><br />";
}
curl_close($ch);
echo $html->find('displaybody', 0)->innertext;
?>
第127行的陳述是什麼? – 2012-03-05 10:32:47
這是默認的簡單的HTML DOM文件,這不是我問的主要問題,順便提一句,第127行的語句是,函數__destruct() {this-> clear(); } – 2012-03-05 11:06:11