2015-04-28 259 views
-1

我有一個php腳本來下載一些網頁。問題是下載的文件沒有獲得由javascript編寫的動態內容。用javascript動態內容下載網頁

我想我需要一個JavaScript引擎或類似的東西。是否有一些PHP庫或命令行程序下載一個網頁及其所有的動態內容?

我需要的例子:我想下載網頁www.example.com/product.html

現在:我可以下載代碼:

<h1></h1> 

我想要什麼:我想下載的代碼:

<h1>Title written by javascript</h1> 
+1

請張貼相關的代碼以及。 – Vijay

+0

正在打印爲您提供一個選項? – colecmc

回答

0

這是發生因爲JavaScript是不正確下載。您只下載HTML文件,而不是附加的JavaScript文件。

一旦JavaScript可用於HTML頁面,所有動態內容都會正確顯示。

另一種解決方法: 您可以使用像硒,實際上在瀏覽器中打開頁面的Web自動化庫,讓瀏覽器執行js和準備DOM。在此之後,您可以下載HTML內容。

還有一個:

您可以使用PhantomJs的下載HTML頁面,處理Javascript和給你保存最終輸出。

https://superuser.com/questions/448514/command-line-browser-with-js-support

+1

我不想要JavaScript文件,我需要通過HTML編寫的javascript生成的內容。 –

+0

一個好的解決方案可能是一個命令行瀏覽器。但我不知道它是否存在。我知道Lynx,但它沒有JavaScript引擎 –

+0

您至少需要一段時間的js文件。即使瀏覽器也必須下載js文件才能執行它們。 – ekuusela