3
我想從海盜灣的統計信息,統計資料可以在下面的div被發現TPB:獲取HTML從捲曲和帶HTML與網頁預浸替換
<div id="stats">5.695.184 registered users Last updated 14:46:05.<br />35.339.741 peers (25.796.820 seeders + 9.542.921 leechers) in 4.549.473 torrents.<br /> </div>
這是我的代碼:
<?php
$ch = curl_init();
$timeout = 5;
curl_setopt($ch, CURLOPT_URL,"http://thepiratebay.se");
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($ch,CURLOPT_CONNECTTIMEOUT,$timeout);
curl_setopt($ch,CURLOPT_COOKIE,"language=nl_NL; c[thepiratebay.se][/][language]=nl_NL");
$data=curl_exec($ch);
$data = preg_replace('/(.*?)(<div id="stats">)(.*?)(<\/div>)(.*?)/','$2',$data);
echo $data;
curl_close($ch);
exit;
?>
正如你可以看到我用下面的preg-replace
模式剝去HTML:
$data = preg_replace('/(.*?)(<div id="stats">)(.*?)(<\/div>)(.*?)/','$2',$data);
但那不起作用。我得到了TPB的整個頁面,而不僅僅是統計數據。有人有答案嗎?
在此先感謝。
爲什麼你不只是'返回strip_tags(trim($ xml-> getElementById('stats') - > nodeValue));'? – DaveRandom
有趣的是,我只是假設它會...現在有一個發揮。 – DaveRandom
其實您的代碼段工作; p –