mechanize-ruby

    1熱度

    2回答

    當使用機械化拉從Craigslist的一些數據,我不斷收到在Heroku以下錯誤:status: Net::HTTPForbidden 1.1 403 Forbidden 我想知道有一些方法來防止這種情況發生,我的設置如下: agent = Mechanize.new do |agent| agent.log = @logger agent.user_agent_alia

    0熱度

    1回答

    我正在嘗試處理HTML表中特定行中的鏈接。 該表格有一個日期列和城市名稱列作爲鏈接​​。我需要找到具有特定日期的行,然後循環遍歷從同一行中的下一個單元格中找到的鏈接。 我伸手從以前的頁面與機械化的目標頁面(鏈接到頁面在前面的頁面,這樣直接的聯繫是不可能產生的),我能夠選擇與此說表: agent.page.search("//table[@class='calendar']") 但是,在此之後,

    1熱度

    1回答

    我需要通過履帶登錄到詹金斯收集一些數據,但網/ HTTPS相比,詹金斯的源得到一個不完整的頁面,這裏有兩個來源: 淨/ HTTPS」 HTML <!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN" "http://www.w3.org/TR/REC-html40/loose.dtd"> <html> <head

    0熱度

    1回答

    我想從使用機械化的網站返回電子郵件地址。通過使用下面的代碼,我很容易確定是否在頁面上找到了「@」符號。 但是,我想返回@符號周圍的字符以確定它是否可能是電子郵件地址。任何人都知道,一旦找到了@我可能會返回周圍的角色? 我知道機械化可以返回鏈接,但電子郵件地址可能不是鏈接。謝謝! require 'mechanize' mechanize = Mechanize.new { |agent|

    0熱度

    1回答

    我很努力向表單添加字段,因爲機械化不檢測字段。 我有3種形式,我設法選擇正確的形式。 進入p site.forms給出如下: => [#<Mechanize::Form {name "userloginform"} {method "POST"} {action "/user?destination="} {fields [text:0xc01f34 type: text nam

    0熱度

    3回答

    運行此代碼mecahnize 2.7.3和紅寶石2.3.0dev: require 'mechanize' agent = Mechanize.new agent.keep_alive = false agent.open_timeout = 2 agent.read_timeout = 2 agent.ignore_bad_chunking = true agent.gzip_en

    0熱度

    1回答

    這裏機械化內存泄漏是一個示例腳本再現問題 require 'mechanize' agent = Mechanize.new agent.history.max_size = 0 5000.times do |i| agent.get('http://www.yahoo.com') agent.history.clear p `ps -o rss -p #

    0熱度

    1回答

    我一直很努力,但我不能讓這個網頁上這些特定鏈接: http://www.windowsphone.com/en-us/store/top-free-apps 我想在這個頁面左側的鏈接中的每一個,娛樂例如,但我不能找到合適的參考獲取它們。 它的腳本: require 'mechanize' agent = Mechanize.new page = agent.get("http://www.wi

    0熱度

    1回答

    我想,當我打寶石安裝機械化,幾秒鐘後,我的Mac操作系統上安裝mechainze寶石,但是,POP操作了: Building native extensions. This could take a while... ERROR: Error installing mechanize: ERROR: Failed to build gem native extension.

    0熱度

    2回答

    task :fetch_front => :environment do require 'rubygems' require 'nokogiri' require 'open-uri' require 'mechanize' agent = Mechanize.new agent.get("http://www.reddit.com/") agent.p