我想解析包含希伯來字符的XML文件。 我知道該文件是正確的,因爲如果我輸出文件(來自不同的軟件)沒有希伯來字符,它解析得很好。MalformedByteSequenceException:1字節UTF-8序列的無效字節1。當使用希伯來字符
我試過很多東西,但我總是得到這個錯誤
MalformedByteSequenceException: Invalid byte 1 of 1-byte UTF-8 sequence.
我最新的嘗試是使用FileInputStream
打開它,並指定編碼
DocumentBuilder db = dbf.newDocumentBuilder();
document = db.parse(new FileInputStream(new File(xmlFileName)), "Cp1252");
(Cp1252
是,工作編碼我在一個不同的應用程序) 但我得到了同樣的結果。
嘗試使用ByteArray
以及,沒有任何工作。
有什麼建議嗎?
如何在文件編碼?你用什麼來解析它? – Joni
我不太確定該文件的編碼是什麼。它缺少第一行中的編碼部分..我使用內置於DocumentBuilder.parse –
中的java解析的第二個參數是系統標識,而不是字符編碼。 – jtahlborn