4
快速而簡單:提取HREF值使用XPath Python的2.7
<a href="some content">Click here</a>
我如何可以提取「某些內容」和「點擊我」使用XPath的蟒蛇?
到目前爲止,我有以下的(僅提取 「某些內容」 從HREF結果):
import lxml.etree as LE
import requests
r = requests.get("http://localhost")
html = r.text
root = LH.fromstring(html)
print root.xpath('//a/@href')
感謝adavance。
你有使用XPath?正則表達式應該適用於HTML。 – b10hazard 2013-03-07 13:14:29
我曾經與正則表達式做...但後來我在膝蓋上的箭頭。拋開笑話。正則表達式不推薦用於解析html/xml結果:) – 2013-03-07 13:25:19
啊,我明白了。我不熟悉xpath。也許我會在下次需要解析html時嘗試一下。 – b10hazard 2013-03-07 13:37:53