1
解析HTML下面是我的網站上出現的HTML
:如何使用lxml.html庫
<meta content="auth" name="param" />
<meta content="I_WANT_THIS" name="token" />
如何使用lxml.html搶呢?
解析HTML下面是我的網站上出現的HTML
:如何使用lxml.html庫
<meta content="auth" name="param" />
<meta content="I_WANT_THIS" name="token" />
如何使用lxml.html搶呢?
使用xpath來查找name
屬性meta
標籤,並得到content
屬性的值:
from lxml.html import fromstring
html_data = """ <meta content="auth" name="param" />
<meta content="I_WANT_THIS" name="token" />"""
tree = fromstring(html_data)
print tree.xpath('//meta[@name="token"]/@content')
打印:
['I_WANT_THIS']
你能解釋什麼是」 .//meta[@name= 「token」]/@ content'「呢? – user3412816
@ user3412816是的,它是一個xpath表達式,它基本上是這樣的:在html中的任何位置找到我的meta標籤,這個meta標籤顯示有一個屬性'name',值爲'token',然後給我'content 'attrubite。 – alecxe
這確實有幫助。謝謝! – user3412816