我想從網站抓取數據。我用這個代碼從scrapy中的多個類獲取文本
import scrapy
class KamusSetSpider(scrapy.Spider):
name = "kamusset_spider"
start_urls = ['http://kbbi.web.id/abadi']
def parse(self, response):
SET_SELECTOR = '.tur highlight'
for brickset in response.css(SET_SELECTOR):
yield {
'name': brickset.css(SET_SELECTOR).extract_first(),
}
,這是檢查元素:
我想在紅色橢圓每一個文字,像mengabadi,mengabadikan等有多個類'b'標記=> tur突出顯示。但是,我沒有得到任何結果。
什麼問題?如何解決它? 我已經改變我的代碼變成這樣:
def parse(self, response):
for kamusset in response.css("div#d1"):
text = kamusset.css("div.sub_17 b.tur.highlight::text").extract()
print(dict(text=text))
,但仍然沒有工作。它返回null。
的選擇應該是'」 .tur.highlight'' ... –