2015-04-23 40 views
3

我用cheerio模塊從網站上刮取產品清單。但有問題,網站使用「無限滾動」來加載數據(向下滾動時數據加載更多)。所以,cheerio無法獲得所有產品。用cheerio和nodejs颳去數據

有人可以建議我解決這個問題嗎?謝謝。

+1

只是從他們用來填充內容的api抓取數據;在滾動時觀看devtools中的網絡標籤,注意新添加的網址。然後調用url直接獲取json,而不是試圖抓取HTML。 – dandavis

+0

對於常見的頁面信息,你可以使用https://github.com/Mitica/html-explorer – dumitru

回答

1

您可以查看滾動時頁面執行哪種查詢。然後只需自己點擊這些查詢並獲取數據。

或者,您可以嘗試使用類似node-phantom-simple的東西,通過Phantom觸發滾動並刮擦。

我會自己與第一個選項。