我正在將一個CSV文件導入到Ruby(1.8.7)中。 。File.open( '路徑/到/ FILE.CSV')讀返回此在控制檯:Ruby和編碼轉換
Stefan,Engstr\232m
編碼由UniversalDetector會(chardet的寶石)鑑定爲異8859-2。
UniversalDetector::chardet("Stefan,Engstr\232m")
=> {"confidence"=>0.626936305574385, "encoding"=>"ISO-8859-2"}
試圖將字符串轉換產生如下:
Iconv.conv("UTF-8", "ISO-8859-2", "Stefan,Engstr\232m")
=> "Stefan,Engstrm"
,而我希望:
=> "Stefan,Engström"
- 能串真的是在一些其他的編碼?
- 我之前沒有看到\ 232語法,通常當字符串被奇怪地編碼時,會出現一些奇怪的字符。 或一些中國人。
讓我知道,如果我應該提供更多的信息或闡述一些事情。
它看起來並不像它的'ISO-8859-2'。這將是'\ 246' http://en.wikipedia.org/wiki/ISO_8859-2 –
@Kassym:在ISO 8859-2中它將是'\ 366',''\ nnn''表示法使用八進制。 –