2015-01-13 99 views
-2

我想使用XPath解析HTML文檔。我在php中使用file_get_contents()函數「提取」HTML文檔的內容。使用php觸發JavaScript滾動事件

問題是,我永遠不會得到頁面的全部內容,因爲有一些JavaScript實現,當用戶滾動時請求更多的內容。例如:demo

我已經閱讀了關於answer on another stack exchange portal中提到的一些「瀏覽器組件」,但我無法找到符合我的特殊需求的東西。

有沒有辦法用php觸發這些滾動事件?有沒有其他的選擇我如何獲得整頁內容?

+0

不能。你不能做任何與JavaScript相關的或與PHP相關的東西。但是,您可以解析最後出現的ID的html源代碼,然後通過向特定腳本發出請求來請求更多數據。只要看看你的鏈接演示的源代碼。 –

+0

在PHP中,您應該獲得最大數量的元素(即前10個元素),並通過ajax(即11到20,21到30等)發送下一個開始和結束限制到服務器以便獲取更多元素並呈現它們。 –

回答

0

我假設你想刮頁。 我會避免在這裏使用PHP。 用刮取頁面PhantomJS可能會導致更堅實的方法。

不過你問了一個php解決方案。

使用的技術稱爲ajax分頁。 您可以使用瀏覽器的網頁開發工具找出網址和參數(查看工具的網絡部分)。

我更喜歡Firefox的Firebug。

當你得到正確的參數後,你可以調用這個URL file_get_contents(),通過調整參數你可以加載下面的頁面。