我有一個json文件,存儲一些用戶信息,包括id,名稱和url。該json文件看起來像如何在scrapy中讀取json文件中的行
{"link": "https://www.domain.com/user1", "id": 1, "name": "user1"}
{"link": "https://www.domain.com/user1", "id": 2, "name": "user2"}
此文件是由scrapy蜘蛛寫的。現在我想從json文件中讀取url,並抓取每個用戶的網頁。但我無法從json文件加載數據。
在這個時候,我不知道如何獲得這些網址。我想我應該首先閱讀json文件中的行。我想下面的代碼在Python Shell
>>> import json
>>> f = open('links.jl')
>>> line = json.load(f)
,我得到了以下錯誤消息
Raise ValueError(errmsg("Extra data", s, end, len(s)))
ValueError: Extra data: line 2 column 1- line 138 column 497(char498-67908)
我做了一些在線搜索。搜索建議json文件可能有一些格式問題。但是json文件是使用scrapy管道創建和填充項目的。是否有人知道是什麼原因導致了錯誤?以及如何解決它?有關閱讀網址的任何建議?
非常感謝,
奧利維亞
你肯定有每個JSON對象之間的空行?你可以確認,以及scrapy版本。 –