我想通過在NodeJs
上運行javascript
代碼來獲取網頁的內容。我希望內容與我在瀏覽器中看到的內容完全相同。如何獲取HTTPS網頁的內容?
我用下面的代碼,但我得到了response
405
。
var fs = require('fs');
var link = 'https://www.realtor.ca/Residential/Single-Family/17219235/2103-1185-THE-HIGH-STREET-Coquitlam-British-Columbia-V3B0A9';
var request = require('request');
request(link, function (error, response, body) {
fs.writeFile("realestatedata.html", body, function(err) {
if(err) {
console.log('error in saving the file');
return console.log(err);
}
console.log("The file was saved!");
});
})
保存的文件與我在瀏覽器中看到的內容無關。
看來您發送的請求不被服務器支持。您是否嘗試過請求('https://www.realtor.ca/Residential/Single-Family/17219235/2103-1185-THE-HIGH-STREET-Coquitlam-British-Columbia-V3B0A9').pipe(fs.createWriteStream( 'realestatedata.html'))? 請注意,無論如何,當您只打開html時頁面將不會呈現相同的方式,因爲它還需要許多其他資源(顯示頁面時會完成110個請求)。 –
我嘗試了以'www'和'realtor.ca'開頭的URL,但都沒有成功。如何才能使它工作?我的意思是我如何運行所有110個請求? –