2010-10-14 55 views

回答

1

相當容易,稍微有點冒險的方式:假設您已經使用lxml.html.parse或任何一種方法來構建DOM,您可以將其作爲兩步過程的一部分來完成。

  1. 使用字符串替換遍歷節點的文本和尾部屬性。看看iterdescendants的方法,它可以爲你解決所有問題。每正常

  • lxml.html.clean作爲一個更復雜的方法是將猴修補lxml.html.clean模塊。與許多lxml不同,這個模塊是用Python編寫的,並且相當易於訪問。例如,目前有一個_substitute_whitespace函數。