0
我找這類表的內容:Trulia表可以僅使用scrapy報廢嗎?
http://www.trulia.com/school-district/CA-San_Francisco_County/San_Francisco_Unified/
我可以得到行通過:
rows = response.xpath('//*[@id="middle_tab_content"]/table/tr[]').extract()
的問題是,有表中多個頁面保持相同鏈接
http://www.trulia.com/school-district/CA-San_Francisco_County/San_Francisco_Unified/
而行也保持相同的Xpath,表中沒有變化
編輯。
@Salman:我看到網絡選項卡,但無法找到XHR子選項卡
你是怎麼得到這個地址的?它在我使用鉻的「檢查元素」中。 –
進入'網絡'選項卡,然後選擇'XHR'子選項卡。在這裏你可以看到'xhr'請求。 –
我看到網絡選項卡,但無法找到XHR子標籤 –