2013-03-12 136 views
0

我有一個從Word插入的XML文檔。來自用戶的細節有點粗略,但我相信通過從Word複製來插入XML。所需的功能是將複製的MS Word格式的文本插入到xml文檔中,並將其存儲在數據庫中以供稍後導出。除了一個奇怪的標籤外,最初的XML看起來不錯。來自Word的XML文檔問題

<?xml:namespace prefix = o ns = "urn:schemas-microsoft-com:office:office" /> 

此標記的作用是不允許在Visual Studio 2010和IE 8中解析XML。刪除此標記後會出現另一個錯誤。

End tag 'FONT' does not match the start tag 'P'. Error processing resource 

這似乎是微軟在XML標籤內生成的HTML有問題。我不是XML專家.... MS從Word生成的HTML有問題嗎?爲什麼刪除標籤有幫助?

回答

0

MS Word會產生可怕的標記 - 以XML格式存儲是可能的最糟糕的方式。如果你必須保留不好的格式化數據,關係數據庫將是更好的解決方案,否則將需要刪除格式或手動更正它。

+0

@John ....是的,插入的格式化HTML存儲在數據庫中,然後插入到XML中。同意,醜陋! – MikeTWebb 2013-03-13 14:31:58