Q

如何使用lxml.html庫

2014-03-12 37 views 1 likes

1

解析HTML下面是我的網站上出現的HTML：如何使用lxml.html庫

<meta content="auth" name="param" /> 
<meta content="I_WANT_THIS" name="token" />

如何使用lxml.html搶呢？

2014-03-12 user3412816

A

回答

2

使用xpath來查找name屬性meta標籤，並得到content屬性的值：

from lxml.html import fromstring 


html_data = """ <meta content="auth" name="param" /> 
<meta content="I_WANT_THIS" name="token" />""" 

tree = fromstring(html_data) 
print tree.xpath('//meta[@name="token"]/@content')

打印：

['I_WANT_THIS']

2014-03-12 21:47:32 alecxe

+0

你能解釋什麼是」 .//meta[@name= 「token」]/@ content'「呢？ – user3412816

+0

@ user3412816是的，它是一個xpath表達式，它基本上是這樣的：在html中的任何位置找到我的meta標籤，這個meta標籤顯示有一個屬性'name'，值爲'token'，然後給我'content 'attrubite。 – alecxe

+0

這確實有幫助。謝謝！ – user3412816

相關問題

11. python - 使用xpath語法解析帶有lxml.html的html表單
12. lxml.html解析和utf-8與請求
13. python lxml.html給元素添加空間
14. lxml.html忽略正文類屬性
15. lxml.html通過搜索關鍵字
16. lxml（或lxml.html）：打印樹結構
17. 如何使用Graphview庫
18. 如何使用本機庫
19. 如何使用cublas庫
20. 如何使用設計庫
21. 如何使用庫對象？
22. 如何使用snopt庫？
23. 如何使用Tortoisesvn庫？
24. 如何使用數據庫
25. 如何使用net.sf.json庫
26. 如何使用庫的cocos2d
27. 如何使用庫MySQLi PHP
28. 如何使用stocktwits庫？
29. 如何使用regexp-me庫？
30. 如何使用改造庫