2012-06-13 32 views
1

我運行下面的代碼時出現以下錯誤:角度來說,Hpricot - UTF-8的問題

invalid byte sequence in UTF-8 (ArgumentError) 

代碼:

require 'hpricot' 
require 'open-uri' 

doc = open('http://www.amazon.co.jp/') {|f| Hpricot(f.read) } 
puts doc.to_html 

角度來說,Hpricot無法解析日本的內容。有關解決此問題的任何建議?

回答

2

該網站似乎並沒有使用UTF-8:​​。

試試這個:

open('http://www.amazon.co.jp/') {|f| Hpricot(f.read.encode("UTF-8")) } 
+0

很不錯的!修復了這個問題。謝謝。 –