我將遷移Lotus Notes數據庫的內容到SharePoint。整個數據庫被導出到XML文件(這個要求不能改變),我必須解析這些XML文件並將數據插入SharePoint。從Lotus Notes XML富文本元素中提取文本
什麼讓我起來是包含豐富文本的元素。該XML元素包含在http://publib.boulder.ibm.com/infocenter/domhelp/v8r0/index.jsp?topic=%2Fcom.ibm.designer.domino.main.doc%2FH_PARAGRAPH_DEFINITIONS_ELEMENT_XML.html
描述在使用DXL Lotus Notes中的領域使用的確切富文本格式的XML表示我不需要保持文本的實際格式(除非這是因爲同樣容易檢索純文本),但是如果我只是簡單地提取包含富文本的XML元素的值(使用LinqToXML),我就可以得到沒有換行符的純文本,這是不可接受的。此外,嵌入的圖像作爲base64編碼的字符串顯示在檢索到的文本中(它們嵌入在XML中)。
任何人都可以提供有關如何從XML元素中提取文本的指導,既可以將RTF格式插入到RTF文件中,也可以將純文本包含正確的換行符並且不包含嵌入圖像?
感謝您的建議。可悲的是我無法控制如何創建導出XML或使用哪種格式。 – michn