我正在嘗試使用scrapy,並且我嘗試使用這個可笑的html。使用XPath檢查Firefox的插件,這是在表的第一行:scrapy,無效的xpath,起始位置
id('page')/x:table/x:tbody/x:tr[1]/x:td[2]/x:table/x:tbody/x:tr/x:td/x:table/x:tbody/x:tr[1]
我得到一個錯誤,如果我複製的XPath:
def parse(self, response):
hxs = HtmlXParseSelector(response)
data = hx.select("id('page')/x:table/x:tbody/x:tr[1]/x:td[2]/x:table/x:tbody/x:tr/x:td/x:table/x:tbody/x:tr[1]")
raise ValueError("Invalid XPath: %s" % xpath)
爲什麼它不認識這個xpath?
此外,scrapy是否有辦法從第三行開始抓取所有數據?前兩行是標題和圖例。
因爲它是無效的 – JWiley 2013-03-14 21:05:55
如果你可以提供一個鏈接到你想要抓取的頁面,我們可能會幫忙。 :) – Talvalin 2013-03-14 23:23:57
你註冊了[namespace](http://stackoverflow.com/questions/4817112/xpath-query-for-xml-node-with-colon-in-node-name)嗎? – 2013-03-17 22:51:12