2011-07-09 37 views

回答

2

一種方法,我發現這個代碼:

private string CleanHtml(string html) 
{ 
    // start by completely removing all unwanted tags 
    html = Regex.Replace(html, @"<[/]?(font|span|xml|del|ins|[ovwxp]:\w+)[^>]*?>", "", RegexOptions.IgnoreCase); 
    // then run another pass over the html (twice), removing unwanted attributes 
    html = Regex.Replace(html, @"<([^>]*)(?:class|lang|style|size|face|[ovwxp]:\w+)=(?:'[^']*'|""[^""]*""|[^>]+)([^>]*)>","<$1$2>", RegexOptions.IgnoreCase); 
    html = Regex.Replace(html, @"<([^>]*)(?:class|lang|style|size|face|[ovwxp]:\w+)=(?:'[^']*'|""[^""]*""|[^>]+)([^>]*)>","<$1$2>", RegexOptions.IgnoreCase); 
    return html; 
} 

從這裏:

Remove Microsoft Class and Style attributes

HTH

+0

不適用於我 –

1

我就遇到了這個問題我自己並找不到一個解決方案,沒有刪除所有標籤和格式。有超過100個條目需要統一的各種樣式。我結束了「復位」他們使用CSS:

span{font-family: Arial, Geneva, Helvetica, Verdana !important;font-size: 12px !important;color: #474844 !important;} 

注:這並沒有某些特殊字符的幫助,但它確實讓所有的風格統一。希望這可以幫助!

相關問題