2013-07-04 191 views
-2

之間的文本,我有以下情形:(?解析成樹)解析XML與標籤

<xml>Text text text<a><b></b>Test text</a> text text text<c>text text</c><d><d/><xml> 

我如何解析這個XML讓我把所有的信息。我需要在文本中保留文本和標籤的順序和位置。

感謝您的幫助!

編輯:我已經嘗試使用Java解析器...我沒有設法讓它工作。

+0

到目前爲止......你做了什麼? –

+0

google.com - > java parse xml對第一個結果給了我這個http://www.mkyong.com/java/how-to-read-xml-file-in-java-sax-parser/ – fGo

+0

@Adriano :我嘗試了dom4j解析器...使用xpath可以將文本從標籤中取出...但隨後我失去了所有其他信息 – user2298830

回答

0

這不是一個很好形成的XML。你不能使用標準的解析器。 你必須寫一個你的。

+0

這就是我的想法......您將如何實現這樣的解析器?正則表達式? – user2298830

+0

但它沒有意義,這不是一個XML,你不能像解析它。寫什麼樣的數據你必須保存,也許我們可以選擇一個不同的數據結構 –

+0

我的任務是解析文件的結構像例子,並保存所有的信息到數據庫。 (改變一些信息後,我必須再次創建一個文件) – user2298830