mechanize-ruby

1熱度

1回答

我試圖抓取這些列表，併爲屬於我的客戶的網站上的這些工作列表提供更多曝光。問題是，我需要能夠鏈接到具體的工作列表，以便求職者申請。 This is the page我在嘗試保存來自的商家信息鏈接。這將是理想的，如果我可以保存求職者點擊查看原始列表然後申請的地址。這是什麼網站做不設有網址爲這些頁面是否有可能提供一個列出具體地址如果可能的話，我怎麼能生成地址？如果我不能得到一個特定的地址，我認

1熱度

1回答

Rails ruby-mechanize重定向後如何獲取頁面

我想收集http://www.mims.com/India/Browse/Alphabet/All?cat=Company&tab=company的製造商和他們的醫學細節。機械化寶石被用來提取與瑞安Tutorial 我可以成功登錄的幫助從html頁面的內容，但未能達成desination頁http://www.mims.com/India/Browse/Alphabet/All?cat=Comp

2熱度

1回答

如何將Nokogiri聲明轉換爲機械化以進行屏幕抓取？

我試圖使用機械化來從頁面中尋找一些標籤。我已經成功地使用了Nokogiri來刮擦它們，但現在我正試圖將它們組合成更廣泛的機械類。這裏是引入nokogiri聲明： page = Nokogiri::HTML(open(@model.url, "User-Agent" => request.env['HTTP_USER_AGENT'])) @model.icons = page.css("link[

1熱度

1回答

用機械化刮圖像（紅寶石）

我試圖從機械化的web_page保存圖像。我用這個代碼： @current_agent.get(image_url).save (save_path) 錯誤（我想我有超時設置的問題）： I, [2013-03-25T14:42:13.924694 #31865] INFO -- : Net::HTTP::Get: /i?path=b0312211141_img_id2

0熱度

2回答

機械化鏈接＃點擊vs代理＃得到

我有一個應用程序，查找頁面上的某些鏈接（使用CSS），並通過使用代理＃獲取href值來檢索鏈接引用的頁面。直到今天，這一直工作了幾個月（據推測該網站已經改變了一些東西，因爲其他網站仍然在工作），而不是網站返回一個不同的頁面（在網頁層次結構中，如果這有什麼不同;但它可能是網站決定返回該頁面而不是所請求的頁面）。 page.uri反映了返回的實際URI，它與請求的URI不同，但響應代碼爲200，所以大

4熱度

1回答

機械化cookie_jar不保存會話標記

我使用機械化來根據用戶的請求刮取受密碼保護的網站。我試圖通過運行登錄到站點的Rake任務來分離登錄和搜索功能，並將cookie保存到數據庫中，並由隨後的機械化請求重新使用。我的問題是，cookie_jar.save方法不會將會話cookie /令牌保存到cookie文件中。以下是一個演示一個簡單的例子： require 'mechanize' # Setup Mechanize agents

0熱度

2回答

無法通過Mechanize（Ruby）提交亞馬遜表格

在我寫的腳本中，我代表用戶使用憑據成功登錄到亞馬遜。然後，我正在填寫表單以輸入新地址。這裏是我當前的代碼： class AmazonCrawler def initialize @agent = Mechanize.new do |agent| agent.user_agent_alias = 'Mac Safari' agent.follow_meta

0熱度

1回答

單擊輸入型提交 - 機械化紅寶石

我想點擊一個按鈕，它實際上是一個提交沒有看起來有些東西像這樣的形式，並且將結果存儲在一個對象 <div class="searchBar-input"> <input id="front-page-search" value="Enter Keyword(s)" type="text"> </div> <div class="searchBar-submit"> <in

1熱度

1回答

如何通過Mechanize和Nokogiri刮取數據？

我正在從http://www.screener.in/獲取HTML的應用程序。我可以輸入公司名稱，例如「Atul Auto Ltd」並提交，並從the next page, 刮取以下細節：「CMP/BV」和「CMP」。我使用這個代碼： require 'mechanize' require 'rubygems' require 'nokogiri' Company_name='Atul

0熱度

1回答

獲取計算的字體大小在Rails的

我用Rails 3湊一個網站，做像這樣的查詢： agent = Mechanize.new doc = agent.get(url) 然後我做 doc.search("//div") 它返回一個頁面上所有div的列表。我想選擇具有最大字體大小的div。是否有使用Mechanize，Nokogiri或其他Rails gem來查找div的計算字體大小，並從那裏選擇字體最大的那個？感謝