2016-01-04 34 views
0

我在表刮Trulia的表

http://www.trulia.com/school-district/CA-San_Francisco_County/San_Francisco_Unified/

尋找數據。當搜索的第一個元素的Xpath的「玉(愛麗絲飾)小學」我得到這個:

//*[@id="elementary_tab_content"]/table/tbody/tr[1]/td[2]/a 

當我尋找:

response.xpath('//*[@id="elementary_tab_content"]/table').extract() 

我得到迴應,目前還沒有什麼,我需要

當我嘗試:

response.xpath('//*@id="elementary_tab_content"]/table/tbody/tr[1]/td[2]/a').extract() 

我什麼也沒得到,其實答案是空後,我加上「/ TBODY」

response.xpath('//*[@id="elementary_tab_content"]/table/tbody').extract() 

我怎樣才能提取此表scrapy的數據?

+0

要提高你的問題的清晰度,應指定究竟你正在試圖提取。你需要使用XPath,或者這是你最舒服的東西。此外,一定要閱讀[如何提問](http://stackoverflow.com/help/how-to-ask)指南,包含有關要求的那麼好問題,一些偉大的信息。 –

回答

2

使用類似:

'//*[@id="elementary_tab_content"]/table//tr' 

讓行。

tbody通常是由瀏覽器表響應體內增加,所以不是真的。