0
我有這樣一個結構的HTML文檔:搜索和LXML向上
<html>
<li>
<a href="" />a1</a>
<other tags ... />
<li>
<a href="">a2</a>
<another one tag ... />
<a name=3>
</li>
</li>
<li>
...
</li>
我需要找到所有父一個元素,位於undert 李元素爲a元素建立路徑name = 3。在這個例子中,它應該是a1/a2。我使用LXML寫了這樣的Python代碼:
import lxml
...
def get_path_for_series(self, html, series):
current = html.xpath('//a[@name="%s"]' % series)[0]
path = list()
while True:
category = current.xpath('.//ancestor::li[1]//a[1]')
if len(category) == 0:
break
path.append(self.clear(category[0].text_content()))
current = category[0]
return '/'.join(path)
它正確地找到的第一個元素,但後來我甲肝的infinate循環。我做錯了什麼?