0
一個Scrapy項目我是新來scrapy和我正在尋找一種方式來序列化我的Scrapy項目,以便能夠將屬性添加到我的XML輸出,因爲它看起來是這樣的:序列化XML輸出
<field name='example'> i have some data scraped here </field>
例如,我試圖找到添加「名稱」屬性的方法。我知道這可能是通過重寫XmlItemExporter類中的export_item()方法,但迄今爲止我還沒有運氣。到目前爲止,我XmlExportPipeline看起來是這樣的:
from scrapy.exporters import XmlItemExporter
class XmlExportPipeline(object):
def open_spider(self, spider):
self.file = open('%s_products.xml' % spider.name, 'w+b')
self.exporter = XmlItemExporter(self.file, item_element='field', root_element='items')
self.exporter.start_exporting()
def close_spider(self, spider):
self.exporter.finish_exporting()
self.file.close()
def process_item(self, item, spider):
self.exporter.export_item(item)
return item
而且,到目前爲止,我所有的數據都是我的項目的不同領域,但最好我會有些這些字段等領域的屬性。