0
我的字符串以UTF8代碼點的形式顯示在irb中,我想讓它們顯示爲「真實」字符。例如,將date de d\\u00e9part
更改爲date de départ
或將\\u4f4f\\u6240
更改爲住所
。如何把「date de d \ u00e9part」轉換爲「date dedépart」?
這些字符串是通過讀取File.readlines("myfile.txt")
的文件構建的。 file -I myfile.txt
返回myfile.txt: text/plain; charset=us-ascii
,"date de d\\u00e9part".encoding"
返回#<Encoding:UTF-8>
。
'myfile.txt'確實包含正確的字符串嗎?雙反斜線和'charset = us-ascii'表示它包含'\ u00e9'_literally_,即字符'''''','u','0','0','e'和'9' 。 – Stefan
'myfile.txt'沒有包含正確的字符串,它來自於mongodb轉儲,並且包含字符串,如'\','u','0','0','e'和'9'。 。 – Florent2
我懷疑你的轉儲是JSON格式。如果是這樣,也許你應該閱讀它(並使用名爲「myfile.json」而不是「myfile.txt」的文件)。 –