我試圖解析來自僞XML格式的文件中的文本。我可以得到一個DOM文檔的它時,它有如下結構:解析Java中的僞XML文件
<product>
<product_id>234567</product_id>
<description>abc</description>
</product>
當結構類似於下面我快到的問題發生:
<product>
<product_id>234567</product_id>
<description>abc</description>
<quantity 1:2>
<version>1.1</version>
</quantity 1:2>
<version>1.2</version>
<quantity 2:2>
</quantity 2:2>
</product>
它產生由於空間下面的例外<quantity 1:2>
:
org.xml.sax.SAXParseException:[Fatal Error] :1:167: Element type " quantity " must be followed by either attribute specifications, ">" or "/>"
我可以用下劃線替換空間解決這個問題。問題是結構的大小可能有所不同,並且包含幾個具有相同格式的子節點(<node 1:x>
),並且該文件可以包含數百個要解析的結構。有沒有可用的類來解析這樣的文本返回一個樹狀對象?
我創建了一個類來將該文件預處理爲有效的XML。 – Mane 2012-03-07 22:59:12