2017-03-23 39 views
-1

我正在使用scrapy來抓取。我正在獲取網站的全部內容。scrapy:找到具有特定文本的元素

import scrapy 
import os 

class QuotesSpider(scrapy.Spider): 
    name = "team" 

    def start_requests(self): 
     yield scrapy.Request(url='http://*****.com', callback=self.get_scripts) 

    def get_scripts(self, response): 
     print response.css("body").extract() 

    def get_scripts(self, response): 
     print response.css("body").extract() 

現在我正在尋找一個文本,我可以通過python獲得簡單的搜索文本/子字符串。我想要的是在該文本匹配的地方選擇該選擇器。請讓我們知道什麼是最好的方式來做到這一點。

+1

_「我想要的是在這個文本匹配的地方選擇那個選擇器。」_請用示例輸入HTML來澄清你的問題,你嘗試過的選擇器,你得到的是什麼選擇器,以及你期望的。 –

+0

**要做到這一點的最佳方法是首先閱讀[選擇器]上的Scrapys文檔(https://doc.scrapy.org/zh/latest/topics/selectors.html)。 – rfelten

+0

pritam parua

some description

some description

我不知道選擇器..我想選擇器有文本'pritam parua' –

回答

1

你可以做這樣的事情。

import logging 
logging.info(response.xpath("//*[contains(text(), 'MY TEXT')]")) 

這將打印出帶有刮取值和選擇器的整個對象。

+0

得到錯誤「功能僞元素:: contains()是未知的」 –

+0

@PritamParua我編輯了我的答案。請檢查。 – Umair

相關問題