4
我試圖解析一些XML是按以下格式:LXML eTree iterparse深度
<label>
<name></name>
<sometag></sometag>
<sublabels>
<label></label>
<label></label>
</sublabel>
</label>
與此
for event, element in etree.iterparse(gzip.GzipFile(f), events=('end',), tag='label'):
if event == 'end':
name = element.xpath('name/text()')
解析它產生,因爲
的空 名變量<sublabels>
<label></label>
<label></label>
</sublabel>
問題:
是否有任何方法來設置iterparse的深度或忽略子標籤的標籤,而不是檢查它是否爲空?
該文件是巨大的。一次解析洞洞事件不是一種選擇。 – abruski