1
爲了保持組織有序,我確定有三個項目類,蜘蛛會填充。重新包裝Scrapy蜘蛛項目
每個項目類都有各種填充的字段。
class item_01(Item):
item1 = Field()
item2 = Field()
item3 = Field()
class item_02(Item):
item4 = Field()
item5 = Field()
class item_03(Item):
item6 = Field()
item7 = Field()
item8 = Field()
有多個頁面可以抓取相同的項目。 在蜘蛛中,我使用XPathItemLoader來填充'容器'。
目標是將項目傳遞給mysql管道以填充單個表。但這是問題。
當我產生三個容器(每頁)時,它們作爲三個獨立的容器傳遞到管道中。 他們通過管道作爲他們自己的BaseItem並僅填充他們的mysql表的部分,而將其他列'NULL'。
我想要做的是將這三個容器重新打包到一個BaseItem中,以便它們作爲單個ITEM傳遞到管道中。
有沒有人有任何建議重新包裝的項目?無論是在蜘蛛或管道?
感謝