2017-09-28 30 views
0

我正在嘗試使用node + express + cheerio構建爬網程序。 在路線我把這個:如何使用express.js正確地分配有效負載到GET函數

[index.js]  
app.get('/api/crawler/android', crawlerController.android); 

它調用到控制器

[crawler-controller.js] 
var androidCrawler = require('../crawlers/android') 
module.exports.android = androidCrawler.androidget; 

然後我調用爬蟲(基於cheerio)

[crawler.js] 
var request = require('request'); 
var cheerio = require('cheerio'); 

var androidget =request('https://www.developer-tech.com/categories/Android/', function (error, response, html){ 
      if (!error && response.statusCode == 200) { 
       var $ = cheerio.load(html); 
       var result = {result:[]}; 
       $('article').each(function (i, element) { 
        var Title = $(this).find("h2").text(); 
        var Link = $(this).find("a").attr("href"); 
        var Image = $(this).find("img").attr("src"); 
        var payload = { 
         "Title":Title, 
         "Link":Link, 
         "Image":Image 
        }; 
        result['result'].push(payload);    
       }); 
      console.log("aaa", result); 
      console.log(typeof result); 
      return result; 
     }}); 
module.exports = { 
    getAndroid: function (androidget, res) { 
     res.send(JSON.stringify(result)); 
    } 
} 

當我安慰直接登錄到履帶.js通過終端它正確地返回JSON對象,但我認爲我導出app.get所調用的函數的方式是我錯了,我無法弄清楚。

也許有人可以幫我正確調用爬蟲在我的情況?

回答

0

在回調函數中返回結果沒有任何意義,這樣做什麼也不做。

你可以做的是包裝您的請求的功能,並調用您創建一個回調: // file.js 常量wrapFunction =(URL,回調)=> { 請求(URL,((錯誤,對此,HTML)=> { // ... 回調(結果);} ) }

,然後使用它:

// just an example 
wrapFunction(yourUrl, (result) => { 
    // deal with your result 
}) 

當你有,你可以將其導出並然後在你的中間件中使用它/控制器:

// file.js 
module.exports = wrapFunction; 


// index.js 
const wrapFunction = require('file.js'); // here is your function 
app.get('/yourRoute', (req, res) => { 
    wrapFunction(yourUrl, (result) => { 
    res.send(JSON.stringify(result)); 
    }); 
}) 

您還可以使用承諾:

const wrapFunction = (url) => { 
    return new Promise((resolve, reject) => { 
    request(url, ((error, response, html) => { 
     if (error) reject(error); 
     resolve(result); 
    }); 
    }); 
}; 

然後:

wrapFunction(yourUrl).then(result => { 
    // deal with your result ... 
}).catch(error => { 
    // deal with your error ... 
}); 

希望它有幫助,
致以問候

+0

謝謝,是的,這是我需要的! –

相關問題