Python - 從lxml xpath獲取類

僅將Twitter用作示例而忽略了它們具有完美可用API的事實，以下腳本從用戶頁面獲取當前的第5條推文。Python - 從lxml xpath獲取類

import urllib2 
from lxml import etree 

xpathselector = "/html/body/div/div[2]/div/div[5]/div[2]/div/ol/li[5]/div/div/p" 
url = "https://twitter.com/bmthofficial" 
response = urllib2.urlopen(url) 
htmlparser = etree.HTMLParser() 
tree = etree.parse(response, htmlparser) 
result = tree.xpath(xpathselector) 

print result[0].text

而且這個帖子的時候它打印：

從下午2:30，贏取門票讀書節，並推出

現在，它打印< p的內容> </p>，我會如何獲取P的類名？它的HTML看起來像這樣。

<p class="js-tweet-text tweet-text">From 2.30pm, win tickets to Reading Festival, and introduce <a dir="ltr" class="twitter-atreply pretty-link" href="/bmthofficial"><s>@</s><b>bmthofficial</b></a> onstage!</p>

任何幫助表示讚賞！謝謝！

來源

2013-08-21 user1130601

使用get方法Element：

print result[0].get('class')

打印

js-tweet-text tweet-text

來源

2013-08-21 04:19:46 falsetru

我認爲這將是一些簡單的類似，只是無法找到它的谷歌。謝謝你的幫助！ – user1130601

@ user1130601，如果這對你有幫助，你可以通過[接受答案]（http://meta.stackoverflow.com/a/5235）告訴社區。 – falsetru

Python - 從lxml xpath獲取類

回答

相關問題