我有一份格式與XML格式非常接近的文檔,我從外部源獲得(我無法在源文件中修復它)。但是這個軟件在某一點上是一個行業標準,所以它在我們的許多用戶手中,並且替換這些系統可能會讓我們的用戶花費大筆資金。他們不會這樣做。有時候這個文檔是以完全格式化的XML格式出現的,但在某些情況下,文檔在某些元素的InnerText
中有無效文本。一個這樣的例子是<=>
。我在用戶輸入的文本字段中找到這些字段,並且在生成XML文檔時源應用程序沒有清理。將XML文檔轉換爲XML
我有一個.net應用程序正在閱讀此文檔與XmlReader
對象。在大多數情況下它會成功,因爲在大多數情況下,文檔是有效的XML文檔。但是,如果我得到一個不是XML文檔的文檔,它會引發異常,原因很明顯。
有沒有人知道在加載之前將此文檔轉換爲XML的方式?或者有沒有辦法讓XmlReader
更好地處理錯誤?阻止這個文檔成爲一個有效的XML文檔的數據對我來說並不重要,而且可能會被拋棄。任何對我很重要的東西都被格式化爲有效的XML。
您可以預處理文檔,並在將文檔饋送到XMLReader之前查找特定的無效序列並進行清理。 – 2014-09-10 16:05:47
問題是沒有特定的模式。這是用戶生成的數據,源系統只是在不清除它的情況下將其注入到XML中。 – Jesse 2014-09-10 16:37:26
我更新了問題以反映這個文檔在技術上不是XML文檔。雖然我覺得這是一個挑剔的選票。 – Jesse 2014-09-10 20:56:32