2017-02-23 119 views
1

我想要一個瑞典文txt文件。Ubuntu/Bash上的字符編碼問題

對於特殊字符(如ä或é),我找回這些字符: 。

例如。 r漢族Apornas星球。

我有來自多個來源的多個文件,其中一些給出了正確的結果(例如Dethaärärfel!),其中一些產生了上述問題。

基於這一點,我很確定,問題在於文件的字符(編碼),但我只是無法找到如何在命令行編碼文件。

我已經試過:

iconv -f UTF-8 -t UTF-16 file.txt 

和同類者。 但是我一直在出錯信息。

您有任何提示嗎? 謝謝!

+0

'chardet file.txt'的輸出是什麼? –

+0

瑞典最常見的編碼是'iso-8859-1'和'utf-8'。在現代系統上,'iconv -f iso-8859-1 -t utf-8 file.txt'應該這樣做。在一個蹩腳的舊PuTTY或古老的linux發行版中,'iconv -f utf-8 -t iso-8859-1 file.txt'會。 –

+0

@RicardoBranco,謝謝,那是我失蹤的命令,我沒有! –

回答

1

基於註釋的解決方案是:

首先執行:

chardet file.txt 

找出字符編碼。

然後:

iconv -f iso-8859-1 -t utf-8 file.txt 

打造的 「翻譯」。