我需要抓取一個網站,但問題是,底部沒有鏈接分頁。如果您滾動到底部,數據會附加。現在我怎樣才能讓我的履帶工具發生這種情況?有什麼想法嗎?如何抓取整個網站,如果數據在滾動後用Javascript追加
0
A
回答
1
嘗試檢查在向下滾動時執行以追加數據的腳本。它必須以某種方式檢索附加數據 - 只要看看它在做什麼,並讓你的爬蟲做同樣的事情。
0
使用像Selenium這樣的機器人可以工作,您可以在真實的導航器中模擬真實的用戶。我曾經在facebook上做過的一件事是在C++/Qt中使用JavaScript解釋器,然後通過它發送請求。比Selenium快得多。
我相信Google比你擁有更多的處理能力,網站管理員可以盡其所能解決問題。
相關問題
- 1. 如何在數據庫中添加抓取的網站數據?
- 2. 抓取整個網站python
- 3. 如何從網站上抓取數據
- 4. 如果存在重定向,Google bot會抓取整個網站
- 5. 從網站抓取數據
- 6. 從網站抓取數據
- 7. 如何抓取網站?
- 8. 如何追加多個數據庫抓取?
- 9. 如何抓取一個網站
- 10. 抓取整個網站內容
- 11. Web動態javascript內容抓取網站
- 12. 如何阻止搜索引擎抓取整個網站?
- 13. 如何檢查用戶是否在網站上抓取滾動條?
- 14. Ruby on Rails-滾動後如何抓取頁面上加載的數據?
- 15. 如何使用scrapy抓取網站?
- 16. NodeJS Xray無法抓取到多個網站來抓取數據
- 17. 使用Python抓取網站後獲取特定數據
- 18. 如何使用Python 2從網站上抓取數據?
- 19. 如何使用Jaunt庫從網站上抓取數據?
- 20. 如何從使用Java(Android)的網站上抓取數據?
- 21. 如何從抓取工具獲取數據到我的網站?
- 22. 如何使用循環來抓取R中多個網頁的網站數據?
- 23. 如何通過動態內容加載來抓取網站?
- 24. 我如何從R網站抓取這個網站的信息?
- 25. 如何抓取整個wikimapia?
- 26. 如何使用網頁抓取工具獲取動態生成的JavaScript數據
- 27. 如何從(javascript?)網站進行網絡抓取?
- 28. crawler4j抓取一個網址列表,而不抓取整個網站
- 29. 用c#抓取JavaScript cookie的網站#
- 30. 登錄後用cURL從網站抓取數據?
谷歌如何管理這個?谷歌無法檢查整個腳本,應該有另一種出路,但我會嘗試你的解決方案謝謝:) – user1794257