我試圖得到一個鏈接上的ISO-8859-1編碼點擊一個頁面,所以代碼與此類似:如何設置機械化頁面編碼?
page_result = page.link_with(:text => 'link_text').click
到目前爲止,我得到的結果有錯誤的編碼,所以我看到這樣的字符:
'T�tulo:' instead of 'Título:'
我試過幾種方法,包括:
使用代理偏大的,編碼中的第一個請求:
@page_search = @agent.get( :url => 'http://www.server.com', :headers => { 'Accept-Charset' => 'ISO-8859-1' })
陳述的編碼頁面本身
page_result.encoding = 'ISO-8859-1'
但我必須做一些錯誤的:一個簡單的放始終顯示錯誤的字符。
你知道如何聲明編碼嗎?
由於提前,
添加:可執行例如:
require 'rubygems'
require 'mechanize'
WWW::Mechanize::Util::CODE_DIC[:SJIS] = "ISO-8859-1"
@agent = WWW::Mechanize.new
@page = @agent.get(
:url => 'http://www.mcu.es/webISBN/tituloSimpleFilter.do?cache=init&layout=busquedaisbn&language=es',
:headers => { 'Accept-Charset' => 'utf-8' })
puts @page.body
遺憾的是它不工作... – Juan 2009-12-14 00:57:02