代碼:錯誤使用海葵
require 'anemone'
Anemone.crawl("http://www.example.com/") do |anemone|
anemone.on_every_page do |page|
puts page.url
end
end
當我嘗試這個代碼,我應該得到該網站上所有的URL列表,但我得到的是隻是名字網站。什麼可能是錯誤,我如何得到所有網址列表?
代碼:錯誤使用海葵
require 'anemone'
Anemone.crawl("http://www.example.com/") do |anemone|
anemone.on_every_page do |page|
puts page.url
end
end
當我嘗試這個代碼,我應該得到該網站上所有的URL列表,但我得到的是隻是名字網站。什麼可能是錯誤,我如何得到所有網址列表?
我猜anemone不能跟隨重定向或類似的東西,導致「http://example.com」在其他網站上重定向我。您是否嘗試過抓取其他網站?例如,http://stackoverflow.com。
它工作正常。很明顯,如果你在example.com上這樣做,它只會顯示http://www.example.com,因爲只有這個頁面。 – thoferon