我不得不從一個站點刮項目,我把他們安置在以JSON文件,如下面安排每列一個項目的CSV文件的行scrapy蟒蛇
{
"author": ["TIM ROCK"],
"book_name": ["Truk Lagoon, Pohnpei & Kosrae Dive Guide"],
"category": "Travel",
}
{
"author": ["JOY"],
"book_name": ["PARSER"],
"category": "Accomp",
}
我想將它們存儲在CSV一個字典文件每一行在每一個項目一個列如下
| author | book_name | category |
| TIM ROCK | Truk Lagoon ... | Travel |
| JOY | PARSER | Accomp |
我得到一排一個字典的項目,但與所有的列組合
我pipeline.py
代碼
導入CSV
class Blurb2Pipeline(object):
def __init__(self):
self.brandCategoryCsv = csv.writer(open('blurb.csv', 'wb'))
self.brandCategoryCsv.writerow(['book_name', 'author','category'])
def process_item(self, item, spider):
self.brandCategoryCsv.writerow([item['book_name'].encode('utf-8'),
item['author'].encode('utf-8'),
item['category'].encode('utf-8'),
])
return item
如果其中一個列表有多個成員,會發生什麼? – kojiro
爲什麼使用列表如果你只有一個作者,是書會有多個名字? – dm03514
我只是在那裏作爲一個例子,實際上我有不止一個成員列表,所以當我運行上述我得到「」TypeError:List沒有編碼方法「」。當一個列表包含多個元素時如何做到這一點。當列表包含一個項目 –