2015-02-09 25 views
1

我想抓取一個包含位於url http://my.aup.edu/files/pictures/picture-35933.jpg處的圖片的大文件夾的網站,該網址使用帶有cheerio和請求的nodejs。從頁面中提取一個圖像看起來是這樣的颳去服務器上的一系列網址圖片


var request = require("request"), 
 
    cheerio = require("cheerio"), 
 
    urls = []; 
 
request('', function(err, resp, body){ 
 
    if (!err && resp.statusCode == 200) { 
 
     var $ = cheerio.load(body); 
 
     $('body.img').each(function(){ 
 
      var url = $(this).attr("src"); 
 
      urls.push(url); 
 
     
 
     }); 
 
     
 
     console.log(urls) 
 
    } 
 
    
 
});

這個程序完成登錄網址到控制檯,但它不會保存的圖片。然而,該網站上的文件擴展名有點奇怪,因爲即使鏈接是http://my.aup.edu/files/pictures/picture-35933.jpg並非所有擴展1-99999都有圖像..有些只是重定向到不同的頁面。我可以使用帶有math.random()的if語句來檢查它是否包含img,然後下載它。請讓我知道這是否可能。謝謝!

回答

0

如果你執行一個http HEAD請求而不是http GET,那麼你可以看看內容類型,並且(希望)找出你是否有圖像。