2011-09-09 50 views
2

我們目前正在將一個Intranet應用程序從ASP移植到ASP.NET。 ASP版本使用了很多框架,我試圖在新版本的課程中避免這些框架。在網頁中嵌入HTML或Word格式的文本

該應用程序有一個文檔模塊,我注意到一些文檔的內容是用Word格式的文本填充的。 這會干擾應用程序的佈局。 ASP版本沒有這個問題,因爲它使用框架,因此不會干擾其餘的佈局。

HTML/Word格式的文本被清除與Tidy.NET-library它有一個屬性Word2000。不幸的是,這似乎並沒有清除所有Word格式的文本。 在網頁中插入/顯示Word格式文本的可用選項有哪些?或者是框架唯一的出路?

回答

0

您可以嘗試使用iframe或使用RegEx刪除未被Tidy.NET庫刪除的標記。這裏有一個在.NET中使用正則表達式的教程RegEx tutorial

+0

我認爲正則表達式,但它不是我的一杯茶。我已閱讀並使用了關於編碼恐怖的文章(http://www.codinghorror.com/blog/2006/01/cleaning-words-nasty-html.html),但不幸的是它是由Word保存的HTML而不是常規的Word。也許是時候學習正則表達式了...... – thomasvdb