一個XML文檔,我的影片是從一些內容,人們從各種各樣的地方複製/粘貼(Word文檔主要是雖然)生成的XML文檔。編碼包含U + 001A
它看起來像這樣:
<?xml version="1.0" encoding="UTF-8"?>
<response>
<data> <![CDATA[
(whatever was pasted)
]]></data>
</response>
我一直使用的UTF-8
或iso-8859-1
編碼,但現在有人走了,複製/粘貼Unicode字符U+001A
(0x1a
),我無法找到一個編碼,將接受它。無論使用何種編碼,我將XML文件放入的所有內容(例如Firefox,Internet Explorer,XML Spy)均表示它無效。
是否有一個編碼,我可以使用,這將阻止跌倒過該文件,或者我需要逐個開始剝離所有這些字符了嗎?
不是我希望聽到的,但謝謝。看起來另一件事是「確定很快修復」將會變成另一個漫長的一天。 –