我試圖寫一個eBay的腳本,通過每一個產品進入一個頁面,進入下一個頁面,並做了同樣的Python的Scrapy不會通過所有的標籤
,但由於某種原因,腳本將每下一個頁面,但不是通過一個網頁,我認爲每個項目我都寫正確的選擇
一個UL包含所有李元素代表一個頁面
每個項目,但問題是scrapy只經過冷杉在頁面ST鏈接,跳轉頁面的其餘部分,進入下一個頁面
的每一頁scrapy只需只有一個項目,它應該由一個
我已經使用把所有的項目一個的xpath選擇.//ul[@id="ListViewInner"]/li
的UL與ID ListViewInner
和在它之下的每利
我已經使用CSS選擇.sresult.lvresult.clearfix.li.shic
類,每個Li還但在每種情況下
停止我在這裏爲每個項目部分(其中scrapy應該進入)但退出後,才未通過的將剩餘的第一個元素在頁面
這裏49項是簡單的代碼
class EbayspiderSpider(scrapy.Spider):
name = "ebayspider"
#allowed_domains = ["ebay.com"]
start_urls = ['http://www.ebay.com/sch/hfinney/m.html?item=132127244893&rt=nc&_trksid=p2047675.l2562']
def parse(self, response):
DEF_SELECTOR = './/*[@id="ListViewInner"]/li'
for attr in response.xpath(DEF_SELECTOR):
#item = EbayItem()
#linkse = 'a.vip ::attr(href)'
#link = attr.css(linkse).extract_first()
#yield scrapy.Request(urljoin(response.url, link), callback=self.parse_link, meta={'item': item})"""
print '\n\n\tI AM HERE!!'
#next_page = '.gspr.next ::attr(href)'
#next_page = response.css(next_page).extract_first()
#if next_page:
#yield scrapy.Request(urljoin(response.url, next_page), callback=self.parse)
我曾評論執行部分會導致程序甚至沒有鑼THR ough 50種產品在每個頁面
下面是從頁
我到底做錯了什麼?