0
我正在嘗試使用node + express + cheerio構建爬網程序。 在路線我把這個:如何使用express.js正確地分配有效負載到GET函數
[index.js]
app.get('/api/crawler/android', crawlerController.android);
它調用到控制器
[crawler-controller.js]
var androidCrawler = require('../crawlers/android')
module.exports.android = androidCrawler.androidget;
然後我調用爬蟲(基於cheerio)
[crawler.js]
var request = require('request');
var cheerio = require('cheerio');
var androidget =request('https://www.developer-tech.com/categories/Android/', function (error, response, html){
if (!error && response.statusCode == 200) {
var $ = cheerio.load(html);
var result = {result:[]};
$('article').each(function (i, element) {
var Title = $(this).find("h2").text();
var Link = $(this).find("a").attr("href");
var Image = $(this).find("img").attr("src");
var payload = {
"Title":Title,
"Link":Link,
"Image":Image
};
result['result'].push(payload);
});
console.log("aaa", result);
console.log(typeof result);
return result;
}});
module.exports = {
getAndroid: function (androidget, res) {
res.send(JSON.stringify(result));
}
}
當我安慰直接登錄到履帶.js通過終端它正確地返回JSON對象,但我認爲我導出app.get所調用的函數的方式是我錯了,我無法弄清楚。
也許有人可以幫我正確調用爬蟲在我的情況?
謝謝,是的,這是我需要的! –