-1
我嘗試製作一個WebCrawler,它可以從主頁中找到鏈接並一次又一次訪問找到的鏈接。 現在我已經編寫了一個解析器的代碼,它向我顯示了找到的鏈接並打印了此主頁上某些標記的統計信息但我不知道如何訪問循環中的新鏈接並打印統計信息。Ruby - WebCrawler如何訪問找到的鏈接的鏈接?
所有的*
@visit = {}
@src = Net::HTTP.start(@url.host, @url.port) do |http|
http.get(@url.path)
@content = @src.body
*
def govisit
if @content =~ @commentTag
end
cnt = @content.scan(@aTag)
cnt.each do |link|
@visit[link] = []
end
puts "Links on this site: "
@visit.each do |links|
puts links
end
if @visit.size >= 500
exit 0
end
printStatistics
end