8
我正在使用Nokogiri來抓取網頁。很少有urls需要被猜測,並且當它們不存在時返回404沒有發現錯誤。有沒有辦法捕捉這個異常?如何處理404在Nokogiri中找不到錯誤
http://yoursite/page/38475 #=> page number 38475 doesn't exist
我試過以下哪些方法沒有奏效。
url = "http://yoursite/page/38475"
doc = Nokogiri::HTML(open(url)) do
begin
rescue Exception => e
puts "Try again later"
end
end
我的事情是更好地使用''e.io.not_found – Calin