我得到一些異常的XML文本輸入,如:Java庫逃脫/清理XML?
"<Tag>something</Tag> 8 > 3, 2 < 3, ... <Tag>something</Tag>"
我要清理輸入這樣得到:
"<Tag>something</Tag> 8 > 3, 2 < 3, ... <Tag>something</Tag>"
也就是說,逃避這些特殊符號像<,>時,仍能保留有效的標籤(「,請注意,在同一個案例中)
你知道任何java庫可以做到這一點嗎? 「程序)
孤兒'>'字符不是問題。但是,如何判斷一個特定的'<'字符是一個標籤還是一個小於符號? XML文檔是否遵循單個DTD或XML Schema?或者,'<'*總是*後面跟着一個不是XML中的'Name'的數字嗎? – erickson
他們不是我的XML文檔,也沒有模式。不幸的是,我發現一個「<」符號沒有被一個空格或數字跟隨的情況... – juanmirocks