2011-02-27 31 views
0

我想獲取網頁的內容,但頁面加載2次。simple_html_dom定時器?

似乎有某種計時器,起初它會加載一些內容,然後在10秒鐘後它加載內容的其他部分,我想要得到的內容。

有沒有辦法做到這一點?

Ty;)

+1

你能給一個鏈接/例子嗎? – Shad 2011-02-27 03:21:55

+0

我想從這個網址獲取內容:http://www.onlinegames.net/games/4725/armyswat.html 但是,起初它會暫停,然後在一段時間後加載空洞頁面,因爲我不能使用file_get_html('http://www.onlinegames.net/games/4725/armyswat.html'); 因爲它不加載我想要的內容的部分:(任何想法? – 2011-02-27 07:57:59

回答

0

您需要使用無頭瀏覽器引擎來執行此操作。 cURL和wget是HTTP庫;他們會說HTTP並將文檔下載爲文本。他們沒有DOM或JavaScript引擎的概念,可以幫助他們理解頁面正在做AJAX或JS定時器。所以要下載HTML,你需要一些更像瀏覽器的東西,通過解析一個DOM並執行JS。我推薦使用http://simile.mit.edu/wiki/Crowbar,它使用Mozilla引擎。