2
A
回答
2
檢查單擊按鈕的動作是否執行。它是否調用Javascript函數?這是否會對後端進行HTTP調用?如果是這樣,你的機器人應該這樣做,而不是屏幕抓取第一頁。如果沒有,它只是玩頁面的DOM來在屏幕上顯示一個項目?
1
你所要尋找的數據來自某種後端的,所以如果你在瀏覽器的開發者工具在頁面去看看時,你通常可以找出爲了得到什麼腳本調用數據。
有可能使這更難(這是一些網站來保護自己免受刮傷)。通常情況下,如果您處於這種情況,您所做的事情並不完全合法或不錯。但從技術上講,這非常有趣,所以在這裏。
前進的最好方法是運行在真正的瀏覽器的網站(如PhantomJS,或Chrome),並使用類似的webdriver的框架來模擬瀏覽器交互。通過這種方式,您可以將大部分數據通常拖出。
如果你發現你的ip被封鎖,你可以使用Tor和使用多個實例的動態打到網站...但要確保你很好地詢問網站所有者,如果你允許這樣做那當然。
相關問題
- 1. 如何以編程方式單擊ASP.NET網頁上的按鈕?
- 2. 網絡爬蟲
- 3. 以編程方式登錄Python網絡爬蟲
- 4. C++網絡爬蟲
- 5. PHP網絡爬蟲
- 6. Python網絡爬蟲
- 7. java網絡爬蟲
- 8. 網絡爬蟲類
- 9. 網絡爬蟲的功能
- 10. 網絡爬蟲的Java
- 11. 簡單的網絡爬蟲
- 12. Python中的網絡爬蟲
- 13. 爲高效方式編寫網絡爬蟲的建議
- 14. 網絡爬蟲的正則表達式
- 15. 與Python 2.7.9分頁網絡爬蟲
- 16. 在android上的簡單網絡爬蟲?
- 17. 如何以編程方式刮取網頁並「點擊」一個JavaScript按鈕?
- 18. 自動網絡爬蟲
- 19. 網絡爬蟲,反饋?
- 20. 遞歸網絡爬蟲perl
- 21. 需要網絡爬蟲
- 22. 網絡爬蟲文本雲
- 23. 硒與python網絡爬蟲
- 24. 網絡爬蟲從Android Market
- 25. 網絡爬蟲應用
- 26. 網絡爬蟲不打印
- 27. 網絡爬蟲提取
- 28. 編寫網絡爬蟲模板
- 29. 用Java編寫網絡爬蟲
- 30. 如何以編程方式點擊另一個網站上的按鈕?
取決於「顯示」按鈕的工作方式。但是,通常抓取工具不會點擊按鈕。大多數時候,他們只是解析頁面的來源並關注鏈接。 – GolezTrol