0
我使用lxml.html.cleaner從輸入文本中清除html。如何在lxml.html中將\n
更改爲<br />
?Python lxml.html換行符?
我使用lxml.html.cleaner從輸入文本中清除html。如何在lxml.html中將\n
更改爲<br />
?Python lxml.html換行符?
相當容易,稍微有點冒險的方式:假設您已經使用lxml.html.parse
或任何一種方法來構建DOM,您可以將其作爲兩步過程的一部分來完成。
iterdescendants
的方法,它可以爲你解決所有問題。每正常
lxml.html.clean
作爲一個更復雜的方法是將猴修補lxml.html.clean
模塊。與許多lxml
不同,這個模塊是用Python編寫的,並且相當易於訪問。例如,目前有一個_substitute_whitespace
函數。