15
我試圖從pdf中提取文本並將其寫入json文件。在提取unicode字符時,Json會將所有&轉換爲\ u0026。例如我的實際字符串是ش
。 (代表ش)。它正確打印到.txt文件,控制檯等。但是,當我嘗試將此字符串打印到Json文件時,它顯示\u0026#1588;
。Json將字符串轉換爲<
我使用Java和代碼
Gson gson = new Gson();
String json = gson.toJson(pdfDoc);
注:pdfDoc
是一個對象,包含輸入PDF文檔中的字符的所有細節(位置,顏色,字體...等)。我正在使用gson-2.2.1.jar
。
謝謝。有效。我將代碼更改爲Gson gson = new GsonBuilder()。disableHtmlEscaping()。create(); – Neeraj