我有那些名爲wrong.xml和good.xml的xml文件明顯相同。在解析XML(SAX)之前刪除第一個字符
的代碼是如下:
<?xml version="1.0" encoding="utf-16"?>
<tag>
</tag>
的問題是,XmlReader類(org.xml.sax.XMLReader中)解析wrong.xml當檢測到跟隨誤差。
Content is not allowed in prolog
原因是prolog之前存在隱藏字符。
我只能看到這些字符使用基本的Java文件閱讀器,我可以看到第一個和第二個字符是-1和-2。
'-1''-2'<?xml version>......
記事本,Ultraedit32,寫字板,記事本++等都不能看到它們。
我真正的問題是,我需要從FTP自動讀取xml,然後我需要用任何方式刪除這些字符,然後用xmlReader解析,而不用解析所有文檔,因爲一些文檔非常大。
如何刪除文件的第一個字符?