2011-08-01 113 views

回答

1

您應該首先清理字符串,然後使用truncate words ..如果strip_tags工作不正常,可以使用正則表達式清理標記。

import re 
string = "<a href=''>abc</a>" 
string = re.sub("<\!?\\\\?\/?\w+[^>]*>", "", string) 

這個正則表達式將清理所有的標籤打開,關閉和評論標籤。這是簡單的解決方案,你可以使正則表達式嚴格。而不是\ w +,您可以使用(?:td | span | div ...等)指定要清理的標籤。

1

在截斷文本或使用HTML-truncatewords_html之前標籤條標籤。如果你不這樣做,你正在使用損壞的數據。