2014-01-23 93 views
0

如何從HTML表格代碼中刪除/去除所有格式或樣式信息?如何從HTML表格代碼中刪除/去除所有格式或樣式信息?

我需要刪除所有顏色,字體大小等。可能完全刪除所有styleclass屬性。

也許我想刪除一些標籤和屬性。通過刪除標籤我的意思是留下它的內容,但刪除開始和結束標籤名稱。

+1

任何東西都會適合 – Dims

+0

不僅'style'屬性應該被刪除。也可能是'class'屬性。如果某些標籤用'class'或'style'屬性的'span'標籤封裝,則應刪除整個'span'標籤。 'table','td'和'tr'標籤不應該被移除 – Dims

回答

0

我在VB6中做了這樣的事情。複製下面是代碼。正如你所看到的,代碼只是通過逐字符逐個HTML,並且移除(包括)<和>標籤之間的所有內容。希望你可以在你使用的任何工具中做類似的事情。

Function CleanTags(HTML As String) As String 
    Dim result As String, b As Boolean, c As String, i As Long 
    b = False 
    For i = 1 To Len(HTML) 
    c = Mid(HTML, i, 1) 
    If c = "<" Then b = True 
    If b = False Then result = result & c 
    If c = ">" Then b = False 
    Next i 
CleanTags = result 
End Function 
+0

這將清除所有標籤。我只需要清理格式化標記 – Dims

+0

在這種情況下,我認爲這樣做的唯一方法就是獲得允許標記的白名單或不允許標記的黑名單。 – mti2935

相關問題