我想放棄的大型在線市場網站,有它。我對AJAX頁面想將其設置在一個CentOS VPS會間歇性地獲得該網站上的數據,使我的戰略我的產品供應。Python Scrapy:使用Selenium還是模擬XHR請求會更好?
我是新來的Python和scrapy在這種情況下刮。我已經通過一些網站閱讀了一些關於AJAx組件的信息,並將其廢棄。
方法1. scrapy與硒的相互作用。我在我的vps上安裝整個安裝程序,我不知道這是否可行。硒需要GUI瀏覽器運行嗎?然而,這將是一個很好的設置,它可以快速更改,以防萬一網頁入口將來發生變化。
方法2對於scrapy以模擬XHR請求。在XHR電話會議上有一些研究要做。但是,處理速度會更快,但如果網站將來發生更改,需要更多時間才能進行調整。
任何幫助appreaciated。
XHR請求與任何其他請求相同。此外,佈局比XHR響應更有可能發生變化。所以是的,用chrome加載頁面,打開網絡選項卡找出哪個網址有數據並使用它。 – pguardiario