我想要做網頁抓取,並且我想以JSON格式顯示數據。如何定位行中的第一個ID
我的任務是從網站中提取每篇文章,並以JSON格式顯示其相關數據。我的問題是,我似乎無法定位行(),然後針對每個ID。我可以在我的代碼中輸入id,但我希望程序能夠通過seacrh獲得id,並且控制檯會記錄該行中每個id的數據。 例如:我想通過id獲得第一篇文章的標題。
我希望我有道理。 網站我試圖從數據中提取:
我的代碼:
var express = require('express');
var path = require('path');
var request = require('request');
var cheerio = require('cheerio');
var fs = require('fs');
var app = express();
var port = 8080;
var url= "https://news.ycombinator.com/";
request(url, function(err,resp,body){
var $ = cheerio.load(body);
var title = $('tr');
var uri
var author
var points
var comments
var rank
var posts = {
postTitle : title,
postUri : uri,
postAuthor : author,
postPoints : points,
postComments : comments,
postRank : rank
}
console.log(posts)
})
app.listen(port);
console.log('server is listening on' + port);
我甚至不知道這是可能使用jQuery sintaxe與...的NodeJS,但我認爲,要實現你想要什麼,你需要安裝' jquery'使用npm。 [見這個線程](http://stackoverflow.com/questions/1801160/can-i-use-jquery-with-node-js)。如果你提到它的'身體是相同的圖像,那麼我認爲你可以得到你想要的東西使用jquery nodejs插件 –