0
我遇到了文本文件編碼的問題。文本文件編碼在終端上正確顯示,而不是在編輯器中
如果我用* nix終端工具(如less,cat或更多)打開它,重音字符顯示正確。 但是,如果我用任何編輯器(例如vim)打開它,重音字符將被加密。
我的終端區域設置爲UTF-8,我的編輯器(vim)的默認編碼設置爲UTF-8。如果我用vim打開textfile.txt,我會看到混亂的口音,或者將vim編碼設置爲UTF-8或ISO8859-1。
文件工具的輸出是:
$ file textfile.txt
textfile.txt: ISO-8859 English text, with very long lines
我已經試過的iconv如下:
iconv -f iso-8859-1 -t utf-8 textfile.txt > textfile.utf8.txt
我得到這個
$ file textfile.utf8.txt
textfile.utf8.txt: UTF-8 Unicode English text, with very long lines
打開它用vim不斷顯示亂七八糟的口音,這次即使我使用貓或更多,口音也是亂七八糟的。
我的目標是以UTF-8格式獲取此文件,顯然,正確顯示重音字符。
[蠻力的方法是複製命令「more」的每個輸出屏幕,並將其粘貼到編輯器中。必須有一個更聰明的方法來做到這一點。]
感謝您的任何幫助。
事實證明,該文件包含來自兩種不同編碼的字符,這就是爲什麼可視化在每種情況下都如此混亂,並且iconv沒有設法成功轉換文件。無論如何謝謝大家 –