是否有任何方法可以在N個詞之後拆分長的HTML字符串?很顯然,我可以使用:蟒蛇中的N個詞之後拆分HTML
' '.join(foo.split(' ')[:n])
得到一個純文本字符串的第n個字,但可能會在一個HTML標籤的中間裂開,而且不會產生有效的HTML,因爲它不會關閉已打開的標籤。
我需要在zope/plone網站上做到這一點 - 如果在那些能夠做到的產品中有標準的東西,那將是理想的。
例如,說我有文字:
<p>This is some text with a
<a href="http://www.example.com/" title="Example link">
bit of linked text in it
</a>.
</p>
我問它後5個字分裂,它應該返回:
<p>This is some text with</p>
7個字:
<p>This is some text with a
<a href="http://www.example.com/" title="Example link">
bit
</a>
</p>
你想忽略標籤,這樣他們就不會被分割?換句話說,只能獲取和分割標籤中未包含的文本。 – monkut 2008-12-11 17:03:32
您是否在分解標籤之間的文檔文本(例如,在
和
標籤之間)? – gotgenes 2008-12-11 17:05:12