2016-02-25 85 views
2

我有我從刮掉了一些數據的特定頁面內webscrape,但要收集我需要遵循另一個HREF鏈接收集更多的數據,該特定項目的詳細信息,並且我不不知道如何。Cheerio的Web刮如何將webscrape

這是我到目前爲止有:

 router.get("/:id",function(req,res){ 
     var url = "www.someurl.com" 

     request(url, function (error, response, html){ 
     if (!error && response.statusCode == 200){ 
     $ = cheerio.load(html); 

     $('div.ProductDetails').each(function(){// function for details 
      var self = this; 
      var a = $(this).children().children(); 
      details = a.attr('href'); 

      details = { 
      details:details 
     }; 

這給了我一個鏈接到細節部分與實際的細節。我只需要知道如何在刮刮器內部刮刮。

回答

1

與第一次相同,details.details<a>標記中的網址。

所以,你需要做的請求到該URL

request(details.details, function(err, res, html) { /* code */ })

,然後用cheerio提取數據。

+0

IM試圖通過做另一個請求細節,但即時得到一個錯誤說細節做不這樣定義的。我需要一種方法來設置路由器功能的細節。 –