2011-07-18 45 views
2

我正在使用HTMLEntities來解碼HTML字符串。今天我看到了那個,解碼爲194,而不是160HTMLEntities將 解碼爲ASCII 194,不應該是160嗎?

jruby-1.6.2 :002 > HTMLEntities.new.decode(" ")[0] 
=> 194 

是194正確的,還是我做錯事(或許真的使用UTF-8串用Ruby)?

(=的JRuby 1.6.2,Rails的= 2.3.11,ヶ輛= 4.3.0)

回答

3

你們看到的是兩個字節的UTF-8序列的第一個字節。嘗試解包它看到預期的Unicode代碼點:

HTMLEntities.new.decode(" ").unpack('U*')[0] 
+0

謝謝!這解釋了一切! – dinfuehr

相關問題