0
我有一個片段,可以在URL中成功抓取圖像,事情是,我想從各種網站收集大量圖像,並且我不能每次都手動放置URL 。刮一個頁面的所有URL
由於我是新手,所以你們怎麼面對這個?什麼是颳去每個網址的最佳方式? 我需要URL中的CSV或其他東西嗎?它是自動的嗎?
我的腳本
URL = 'http://www.sitasde.com'
require 'rubygems'
require 'nokogiri'
require 'open-uri'
require 'uri'
def make_absolute(href, root)
URI.parse(root).merge(URI.parse(href)).to_s
end
Nokogiri::HTML(open(URL)).xpath("//img/@src").each do |src|
uri = make_absolute(src,URL)
File.open(File.basename(uri),'wb'){ |f| f.write(open(uri).read) }
end