我正在做一個刮板來下載所有的流亡者的問題,可在http://exile.ru/archive/list.php?IBLOCK_ID=35&PARAMS=ISSUE。只有在存在ruby的情況下才能下載文件
到目前爲止,我的代碼是這樣的:
require 'rubygems'
require 'open-uri'
DATA_DIR = "exile"
Dir.mkdir(DATA_DIR) unless File.exists?(DATA_DIR)
BASE_exile_URL = "http://exile.ru/docs/pdf/issues/exile"
for number in 120..290
numero = BASE_exile_URL + number.to_s + ".pdf"
puts "Downloading issue #{number}"
open(numero) { |f|
File.open("#{DATA_DIR}/#{number}.pdf",'w') do |file|
file.puts f.read
end
}
end
puts "done"
的事情是,很多問題環節的下降,並且代碼爲每一個問題創建一個PDF,如果它是空的,它會留下一個空的PDF。如何更改代碼以便它只能在鏈接存在時創建和複製文件?
這個工作!非常感謝,traybold! – LuisLago