在python scrapy

2017-07-06 30 views 1 likes

獲取文本我得到這個代碼從一個網站：在python scrapy

import scrapy 

class BrickSetSpider(scrapy.Spider): 
    name = "brickset_spider" 
    start_urls = ['http://brickset.com/sets/year-2016'] 

    def parse(self, response): 
     SET_SELECTOR = '.set' 
     for brickset in response.css(SET_SELECTOR): 

      NAME_SELECTOR = 'h1 a ::text' 
      yield { 
       'name': brickset.css(NAME_SELECTOR).extract(), 
      }

我使用的代碼爬行數據。這是運行代碼時的示例結果：

該名稱是extract（）方法的結果。這是檢查元素（鉻）：

我想請教一下，以獲取名稱的結果的方式是10805：環遊世界或只是周圍的世界。怎麼做？

來源

2017-07-06 RiefSapthana

回答

得到「10805：環遊世界」的收益率更改爲：

yield { 
      'name': " ".join(brickset.css(NAME_SELECTOR).extract()), 
     }

要獲得「環遊世界」的收益率更改爲：

yield { 
      'name': brickset.css(NAME_SELECTOR).extract()[-1], 
     }

來源

2017-07-06 10:22:47 yaizer

相關問題

1. Scrapy Python中的Scrapy
2. 如何在Python Scrapy
3. Python Scrapy allowed_damins Attriute
4. Python Scrapy Xpath？
5. Scrapy和Python。 NameError
6. Python Scrapy XPathSelector
7. scrapy - python問題
8. Python/Scrapy - UnicodeDecodeError
9. 信息對Scrapy CONCURRENT_REQUESTS在Python
10. 的Python和Scrapy：問題與Scrapy版本