我有從CP1250到UTF-8的正確編碼文件的問題。幾乎所有字符都正確轉換,但字符「N」和「R」沒有(有「?」字符「)。在Java中從CP1250到UTF-8的錯誤/奇怪的編碼文件
在Netbeans的我設置項目UTF-8編碼。
測試字符串的文件中可以是「skříňSKŘÍŇ」。在控制檯輸出:「skĹ™ĂĹ? ?。SKL ATL‡」輸出轉換,例如,在PHP不同,我到底
我的代碼:
BufferedReader br = new BufferedReader(new InputStreamReader(new FileInputStream("file-cp1250.txt"), "CP1250"));
while ((line = br.readLine()) != null) {
line = new String(line.getBytes("UTF-8"), "CP1250");
System.out.println(line);
}
感謝意見
這沒有任何意義。你的'line'從文件中解碼爲'CP1250'。然後嘗試使用'getBytyes'將其編碼爲utf8,並嘗試將這些utf8字節解碼爲'CP1250'。爲什麼? –
換句話說,你認爲'new String(line.getBytes(「UTF-8」),「CP1250」)的用途是什麼? –