1
我有很多HTML文件與跨類是否可以從每個跨班級中刪除特定的字符?
span class="special-level-1"
span class="special-level-2"
span class="special-level-3"
span class="special-level-4"
span class="special-level-5"
我想刪除每一個*
裏面這些跨度類之一發生。
我已經開始一個python腳本
import sys
from lxml import etree
from lxml.html import parse
doc = parse(sys.argv[1])
span1 = doc.find('//span[@class="special-level-1"]')
span2 = doc.find('//span[@class="special-level-2"]')
span3 = doc.find('//span[@class="special-level-3"]')
span4 = doc.find('//span[@class="special-level-4"]')
span5 = doc.find('//span[@class="special-level-5"]')
span1.getparent().replace("\*", "")
span2.getparent().replace("\*", "")
span3.getparent().replace("\*", "")
span4.getparent().replace("\*", "")
span5.getparent().replace("\*", "")
print etree.tostring(doc)
但這不起作用。這個腳本能被搶救嗎?
感謝您的幫助!我對python很新穎(正如'\ *'而不是'*'所證明的那樣)。 –