Scrapy抓取時可以訪問數據嗎?我有一個腳本可以找到一個特定的關鍵字,並將關鍵字寫入.csv以及找到它的鏈接。但是,我必須等待scrapy才能完成抓取,並且在完成之後,它實際上會輸出.csv文件中的數據。Scrapy - 抓取並隨機更改用戶代理時訪問數據
我也試圖隨意更改我的用戶代理,但它不起作用。 如果我在一個問題中不允許有兩個問題,我會將其作爲一個單獨的問題發佈。
#!/usr/bin/env python
# -*- coding: utf-8 -*-
from scrapy.spiders import Spider
from scrapy import log
from FinalSpider.items import Page
from FinalSpider.settings import USER_AGENT_LIST
from FinalSpider.settings import DOWNLOADER_MIDDLEWARES
import random
import telnetlib
import time
class FinalSpider(Spider):
name = "FinalSpider"
allowed_domains = ['url.com']
start_urls = ['url.com=%d' %(n)
for n in xrange(62L, 62L)]
def parse(self, response):
item = Page()
item['URL'] = response.url
item['Stake'] = ''.join(response.xpath('//div[@class="class"]//span[@class="class" or @class="class"]/text()').extract())
if item['cur'] in [u'50,00', u'100,00']:
return item
# 30% useragent change
class RandomUserAgentMiddleware(object):
def process_request(self, request, spider):
if random.choice(xrange(1,100)) <= 30:
log.msg('Changing UserAgent')
ua = random.choice(USER_AGENT_LIST)
if ua:
request.headers.setdefault('User-Agent', ua)
log.msg('>>>> UserAgent changed')
如果可能,你可以發佈代碼嗎?所以,理解 – WoodChopper
@WoodChopper好了,那就好了。 – user5616520