2014-11-25 52 views
0

我有一些法語代碼點,我想在Linux系統上解碼爲utf-8。 我的文件的內容是(小例子):
問題:從命令行解碼linux機器上的文件

Lemari%C3%A9%20

哪個解碼應該是:Lemarié

我讀到的iconv是實現這個偉大的工具,但我不知道我應-f參數中使用,因爲文件的內容進行編碼,所以我只能用-t選項嘗試沒有成功: iconv -t UTF8 test.csv

有何建議?

+0

什麼是百分號?這使得它看起來像URL編碼文本或其他東西。如果你的文件中有URL編碼文本,那麼我希望每個百分號都被UTF-8當作一個單獨的字符處理。 [你上面的文本,URL解碼](http://urldecode.org/?decode=Lemari%25C3%25A9%2520)和[正確的UTF-8字節序列應該是這樣的](http://hexutf8.com/ ?q =#Lemarié) – jar 2014-11-25 15:21:34

回答

1

從手冊頁,以下是將輸入從ISO88592編碼格式轉換爲UTF8編碼格式的命令。輸出將是output.txt文件。

iconv -f ISO88592 -t UTF8 <input.txt> output.txt 

所以你的情況,-f應與輸入文件的編碼格式使用。像

iconv -f <input file encoding format> -t UTF8 <test.csv> output.txt 
+0

thx這已經很清楚了,問題是什麼字符編碼在處理編碼的字符串時用作'-f' – JBoy 2014-11-25 10:25:03