我需要在網頁上做一些屏幕抓取,其中我需要的內容是由AJAX生成的。在最初的頁面上有一個包含4個選項卡的表格。當您單擊任何選項卡時,表格的內容會發生變化。我只需要第三個標籤中的內容。 我已經使用google chrome'Inspect Element'工具來查看請求和發佈數據是什麼,並且我可以在將信息(會話ID和許多其他cookie數據以及發佈數據)從檢查元素結果到PHP curl請求。但這隻適用於會議持續的30分鐘。有誰知道我可以獲取這些信息的方式嗎?從AJAX/Javascript網頁抓取內容
0
A
回答
0
最後我用htmlunit來獲取我需要的內容。我還發現HTMLUnit Scripter對於幫助生成所需的Java代碼非常有用。
0
我不會重現這裏的代碼,但我會指出你的答案。這本書中 它:
http://www.amazon.com/Webbots-Spiders-Screen-Scrapers-Developing/dp/1593273975/ref=dp_ob_image_bk
A必須買的人做你做的事情。
相關問題
- 1. node-simplecrawler:ajaxed內容網頁抓取問題
- 2. 網頁抓取動態內容與Python
- 3. API Json輸出 - 抓取網頁內容
- 4. 語言的網頁抓取JavaScript內容
- 5. 抓取GWT中網頁的內容
- 6. 網頁抓取動態內容
- 7. 從C#網站抓取內容#
- 8. 網站內容抓取
- 9. 從html頁面抓取內容
- 10. 爲什麼pipelines.py無法保存從網頁抓取的內容?
- 11. 使用jQuery從另一個網頁抓取內容
- 12. 從webhook wordpress抓取內容?
- 13. 從網頁抓取文本
- 14. 抓取網頁,但需要javascript查看頁面內容
- 15. 需要幫助的網頁抓取 - 獲取特定的內容...
- 16. 從前兩頁抓取網頁內容並使用python和BS4將抓取的數據導出到csv
- 17. 抓取整個網站內容
- 18. 建議使用抓取網站內容
- 19. Web動態javascript內容抓取網站
- 20. Perl網頁抓取工具,從DIV中提取內容只有「風格」標籤?
- 21. PHP:如何從網站源頁面提取內容或抓取數據集
- 22. 抓取:內容後
- 23. Nutch不抓取頁面內容
- 24. 從網頁抓取資源網址
- 25. 從網站抓取多個網頁
- 26. 網頁抓取從3GPP網址
- 27. 從網站抓取多個網頁
- 28. 從iframe頁面抓取網頁
- 29. 從抓取的網頁中提取值
- 30. Beautifulsoup網頁抓取
謝謝Aaron,我會檢查一下。 –