1
我想從html代碼中提取一些文本,但以下內容不適用於 而是返回「\ n」。那麼如何獲得一些測試?python lxml:如何從一個具有子元素的元素中獲取文本
a=html.fromstring("""
<p class="clearfix">
<i class="xueli"></i>
sometext
</p>
""")
a.find(".//i").getparent().text
我想從html代碼中提取一些文本,但以下內容不適用於 而是返回「\ n」。那麼如何獲得一些測試?python lxml:如何從一個具有子元素的元素中獲取文本
a=html.fromstring("""
<p class="clearfix">
<i class="xueli"></i>
sometext
</p>
""")
a.find(".//i").getparent().text
相反的.text
,使用text_content()
方法:
In [5]: a.find(".//i").getparent().text_content().strip()
Out[5]: 'sometext'
或者,你可以到以下的i
元素的文字兄弟:
In [6]: a.xpath(".//i/following-sibling::text()")[0].strip()
Out[6]: 'sometext'