我在jar中有一個Unicode(UTF-8無BOM)文本文件,它是作爲資源加載的。Jar資源中的Unicode
URL resource = MyClass.class.getResource("datafile.csv");
InputStream stream = resource.openStream();
BufferedReader reader = new BufferedReader(
new InputStreamReader(stream, Charset.forName("UTF-8")));
這可以在Windows上正常工作,但在Linux上它看起來沒有正確讀取文件 - 重音字符出現破碎。我知道不同的機器可以有不同的默認字符集,但我給它正確的字符集。爲什麼不使用它?
你是如何確定角色被打破了?例如'System.out'被破壞。 – 2009-08-24 01:16:52
數據以網頁形式發佈,以UTF-8編寫。 HTTP頭,XML頭和HTTP-equiv meta都聲稱UTF-8,瀏覽器證實了這一點。 – 2009-08-24 01:27:41