我得到了一些問題,需要幫助..刮內容從網站頁面
我的計劃:從免費代理 1.獲取IP地址(hi去我的屁股) 2.轉換爲XML
$html = file_get_contents('http://www.hidemyass.com/proxy-list/');
//$body = explode('<tbody>', $html);
$body = $html;
$xml = simplexml_load_string("<?xml version='1.0' encoding='utf-8'?><xml />");
$rows = array();
foreach (array_slice(explode('<td>', end($body)), 1) as $row)
{
preg_match('/span>([0-9])<\/span>/', $row, $ids);
preg_match('/span>([0-9])<\/span>/', $row, $dir);
preg_match('/span>([0-9])<\/span>/', $row, $due);
$node = $xml->addChild('train');
$node->addChild('route', $ids[1]);
$node->addChild('direction', $dir[1]);
$node->addChild('due', $due[1]);
}
header('Content-Type: text/xml');
echo $xml->asXML();
但仍不能...
你能幫助我嗎?
感謝 JK
不要使用正則表達式來解析html。 http://stackoverflow.com/a/1732454/118068改用DOM。 – 2012-04-09 18:35:43
waw ...感謝馬克的快速反應..我會學習.. – kimpuler 2012-04-09 18:58:50
剛剛添加了一個完整的工作版本 – Baba 2012-04-09 19:31:25