我正嘗試使用Python和BeautifulSoup訪問特定td標籤中的內容。我可以得到滿足條件的第一個td標籤(使用find),或者全部使用findAll。使用Python和BeautifulSoup解析表格
現在,我可以使用findAll,全部獲取並獲取我想要的內容,但這似乎效率低下(即使我對搜索設置了限制)。無論如何去符合我想要的標準的某個td標籤?說第三個,還是第十個?
這裏是我到目前爲止的代碼:
from __future__ import division
from __future__ import unicode_literals
from __future__ import print_function
from mechanize import Browser
from BeautifulSoup import BeautifulSoup
br = Browser()
url = "http://finance.yahoo.com/q/ks?s=goog+Key+Statistics"
page = br.open(url)
html = page.read()
soup = BeautifulSoup(html)
td = soup.findAll("td", {'class': 'yfnc_tablehead1'})
for x in range(len(td)):
var1 = td[x]
var2 = var1.contents[0]
print(var2)
Hrm,這可能會讓我做我需要做的事情。下班後我會做一些測試。 –
我唯一發現的問題是,它是具有相同信息的相同標籤。除非有能力檢查一個孩子,也許。 –
是的,它是相同的標籤,但您可以在決定是否返回true或false之前檢查子標籤,從而爲您提供所需的所有標籤。 – cerberos