mechanize-ruby

    1熱度

    1回答

    我試圖抓取這些列表,併爲屬於我的客戶的網站上的這些工作列表提供更多曝光。問題是,我需要能夠鏈接到具體的工作列表,以便求職者申請。 This is the page我在嘗試保存來自的商家信息鏈接。 這將是理想的,如果我可以保存求職者點擊查看原始列表然後申請的地址。 這是什麼網站做不設有網址爲這些頁面 是否有可能提供一個列出具體地址 如果可能的話,我怎麼能生成地址? 如果我不能得到一個特定的地址,我認

    1熱度

    1回答

    我想收集http://www.mims.com/India/Browse/Alphabet/All?cat=Company&tab=company的製造商和他們的醫學細節。 機械化寶石被用來提取與瑞安Tutorial 我可以成功登錄的幫助從html頁面的內容,但未能達成desination頁http://www.mims.com/India/Browse/Alphabet/All?cat=Comp

    2熱度

    1回答

    我試圖使用機械化來從頁面中尋找一些標籤。我已經成功地使用了Nokogiri來刮擦它們,但現在我正試圖將它們組合成更廣泛的機械類。這裏是引入nokogiri聲明: page = Nokogiri::HTML(open(@model.url, "User-Agent" => request.env['HTTP_USER_AGENT'])) @model.icons = page.css("link[

    1熱度

    1回答

    我試圖從機械化的web_page保存圖像。我用這個代碼: @current_agent.get(image_url).save (save_path) 錯誤(我想我有超時設置的問題): I, [2013-03-25T14:42:13.924694 #31865] INFO -- : Net::HTTP::Get: /i?path=b0312211141_img_id2

    0熱度

    2回答

    我有一個應用程序,查找頁面上的某些鏈接(使用CSS),並通過使用代理#獲取href值來檢索鏈接引用的頁面。直到今天,這一直工作了幾個月(據推測該網站已經改變了一些東西,因爲其他網站仍然在工作),而不是網站返回一個不同的頁面(在網頁層次結構中,如果這有什麼不同;但它可能是網站決定返回該頁面而不是所請求的頁面)。 page.uri反映了返回的實際URI,它與請求的URI不同,但響應代碼爲200,所以大

    4熱度

    1回答

    我使用機械化來根據用戶的請求刮取受密碼保護的網站。我試圖通過運行登錄到站點的Rake任務來分離登錄和搜索功能,並將cookie保存到數據庫中,並由隨後的機械化請求重新使用。 我的問題是,cookie_jar.save方法不會將會話cookie /令牌保存到cookie文件中。以下是一個演示一個簡單的例子: require 'mechanize' # Setup Mechanize agents

    0熱度

    2回答

    在我寫的腳本中,我代表用戶使用憑據成功登錄到亞馬遜。然後,我正在填寫表單以輸入新地址。這裏是我當前的代碼: class AmazonCrawler def initialize @agent = Mechanize.new do |agent| agent.user_agent_alias = 'Mac Safari' agent.follow_meta

    0熱度

    1回答

    我想點擊一個按鈕,它實際上是一個提交沒有看起來有些東西像這樣的形式,並且將結果存儲在一個對象 <div class="searchBar-input"> <input id="front-page-search" value="Enter Keyword(s)" type="text"> </div> <div class="searchBar-submit"> <in

    1熱度

    1回答

    我正在從http://www.screener.in/獲取HTML的應用程序。 我可以輸入公司名稱,例如「Atul Auto Ltd」並提交,並從the next page, 刮取以下細節:「CMP/BV」和「CMP」。 我使用這個代碼: require 'mechanize' require 'rubygems' require 'nokogiri' Company_name='Atul

    0熱度

    1回答

    我用Rails 3湊一個網站,做像這樣的查詢: agent = Mechanize.new doc = agent.get(url) 然後我做 doc.search("//div") 它返回一個頁面上所有div的列表。我想選擇具有最大字體大小的div。是否有使用Mechanize,Nokogiri或其他Rails gem來查找div的計算字體大小,並從那裏選擇字體最大的那個? 感謝