我想檢索cityname和citycode並將其存儲在一個字符串變量中。圖像顯示的精確位置:Scrapy SgmlLinkExtractor如何定義XPath
谷歌瀏覽器給了我以下XPath:
//*[@id="page"]/main/div[4]/div[2]/div[1]/div/div/div[1]/div[2]/div/div[1]/div/a[1]/span
所以我在scrapy定義了以下語句來獲得所需的信息:
plz = response.xpath('//*[@id="page"]/main/div[4]/div[2]/div[1]/div/div/div[1]/div[2]/div/div[1]/div/a[1]/span/text()').extract()
但是我沒有成功,字符串仍然是空的。我應該使用什麼XPath定義?
你能提供你正在試圖抓取的鏈接嗎?在頁面加載後,城市值可能會被javascript提取。 – jatinderjit
http://www.homegate.ch/kaufen/106015544 – hjschmid
看起來好像城市價值是以某種方式嵌入到href標記中的...... – hjschmid