錯誤使用海葵

從網站獲取URL列表

require 'anemone' 
Anemone.crawl("http://www.example.com/") do |anemone| 
    anemone.on_every_page do |page| 
    puts page.url 
    end 
end

當我嘗試這個代碼，我應該得到該網站上所有的URL列表，但我得到的是隻是名字網站。什麼可能是錯誤，我如何得到所有網址列表？

2012-09-04 Anu11

它工作正常。很明顯，如果你在example.com上這樣做，它只會顯示http://www.example.com，因爲只有這個頁面。 – thoferon

我猜anemone不能跟隨重定向或類似的東西，導致「http://example.com」在其他網站上重定向我。您是否嘗試過抓取其他網站？例如，http://stackoverflow.com。

2012-09-04 09:11:49 railscard

是的，我也嘗試過其他網站，但它不工作。 – Anu11

這只是一個代理錯誤，並且在設置終端代理後，它工作正常。是否有任何方法在代碼設置中包含腳本本身？ – Anu11

當然，Anemone.crawl（url，{：proxy_host =>'您的代理主機'，：proxy_port =>'您的代理端口'}） – railscard

回答