我試圖從一個流行的新聞網站刮評論使用捲曲的學術研究。它適用於文章< 300評論,但之後,它掙扎。使用捲曲刮大頁
$handle = curl_init($url);
curl_setopt($handle, CURLOPT_RETURNTRANSFER, true);
$html = curl_exec($handle);
curl_close($handle);
echo $html; //just to see what's been scraped
但它只盡管總有被700+返回36篇評論:http://www.guardian.co.uk/commentisfree/2012/aug/21/everyones-talking-about-rape?commentpage=all#start-of-comments
爲什麼掙扎的文章一噸註釋?
你應該檢查[Scrapy](http://scrapy.org/)... –
有用途分頁。你需要知道頁數和使用週期從每個頁面獲取評論。 –