python lxml：如何從一個具有子元素的元素中獲取文本

我想從html代碼中提取一些文本，但以下內容不適用於而是返回「\ n」。那麼如何獲得一些測試？python lxml：如何從一個具有子元素的元素中獲取文本

a=html.fromstring(""" 
<p class="clearfix"> 
<i class="xueli"></i> 
sometext 
</p> 
""") 
a.find(".//i").getparent().text

2016-10-03 Daniel Wu

相反的.text，使用text_content()方法：

In [5]: a.find(".//i").getparent().text_content().strip() 
Out[5]: 'sometext'

或者，你可以到以下的i元素的文字兄弟：

In [6]: a.xpath(".//i/following-sibling::text()")[0].strip() 
Out[6]: 'sometext'

2016-10-03 13:23:57 alecxe

回答