我在做這個教程,http://docs.python-guide.org/en/latest/scenarios/scrape/,要廢棄一個html表,並且效果不好。使用lxml和請求進行HTML刮擦
我的代碼:
import requests
from lxml import html
page = requests.get('http://www.dti.ufv.br/horario/horario.asp?ano=2015&semestre=1&depto=MAT')
tree = html.fromstring(page.text)
vaga = tree.xpath('/html/body/center/table/tbody/tr[2]/td/table[2]/tbody/tr[108]/td[9]')
print vaga
我認爲這個問題是使用XPath ...我沒有像使用谷歌Chrome瀏覽器說,教程,但它不是在教程喜歡。任何人都可以幫助我獲得正確的XPath?多謝你們!
你要哪行的HTML內容進行定位? – 2015-02-24 15:48:05