1
我想在我的_init_
方法中使用一個參數「term」。如您所見,當_init
方法獲取此參數時,我想將其用作數據庫集合的名稱並向其中插入數據。但我不知道如何在整個班級中使用_init
的term
的值。那麼,有沒有人有好的建議來處理這個問題?如何在其他方法中使用「_init_」參數?
class EPGDspider(scrapy.Spider):
name = "EPGD"
allowed_domains = ["epgd.biosino.org"]
db = DB_Con()
collection = db.getcollection(term)
def __init__(self, term=None, *args, **kwargs):
super(EPGDspider, self).__init__(*args, **kwargs)
self.start_urls = ['http://epgd.biosino.org/EPGD/search/textsearch.jsp?textquery=%s&submit=Feeling+Lucky' % term]
def parse(self, response):
sel = Selector(response)
sites = sel.xpath('//tr[@class="odd"]|//tr[@class="even"]')
url_list = []
base_url = "http://epgd.biosino.org/EPGD"
for site in sites:
item = EPGD()
item['description'] = map(unicode.strip, site.xpath('td[6]/text()').extract())
self.collection.update({"genID": item['genID']}, dict(item), upsert=True)
yield item
之前作文課,你應該閱讀和研究至少[Python的教程:
然後,在其他方法使用
self.term
參考](https://docs.python.org/2/tutorial/classes.html)。 – Cyb3rFly3r