我們有各種由當前發行版中的應用程序生成的XML文件。其中一些文件包含無效字符,導致它們無效的XML,除非所有驗證都關閉,否則在大多數情況下將無法加載,然後僅在XmlDocument
實例中,而不是XDocument
。如何加載unsanitized XML?
由於這個應用程序已經有那裏,我們必須應付它產生的文件。現在,我可以繼續添加Sanitizer
類型,在知道要查找的內容以及如何在嘗試加載文檔之前解決該問題,但我希望有人可能已經投入了努力來生成可能已經完成的工作一種有效的方式(例如SanitizedXmlReader
類)。
This question涉及同一主題,但我沒有找到滿意的答案。我們只需要刪除XML文件中任何地方無效的內容(而不是僅在CDATA中有效的數據或在QName中未使用的數據)。
那麼,是否存在這樣一種可以將「幾乎」XML文件轉換爲「至少沒有無效字符」XML文件的東西?如果不是,滾動我們自己是下一個選擇。在這種情況下,與其花費時間解釋XML規範來確定哪些字符在所有情況下都是非法的,是否有某個確定的列表?
一個很好的資源!謝謝你。如果你有時間的話,在你的答案中可能會引用相關部分。再次感謝。 – 2009-07-30 17:41:05
@AVD鏈接的頁面似乎不再有效,現在是404。 – jac 2011-11-03 20:08:42