我正在嘗試將一個JSON文件導入到Python中以執行一些數據分析。每個JSON對象都有很多不同的變量(大約7-10)。一些對象具有某些變量,而另一些則不具有某些變量。我特別感興趣的是來自每個json行的五個變量。但是,某些對象缺少數據。我該如何做到這一點,以便該程序將爲每個缺失的數據設置一個無?在Python中缺少數據
import json
data = []
keys = ["hostid","time", "userid","link", "title"]
m = len(keys)
with open('test.json') as json_data:
for line in json_data:
dataline = json.loads(line)
row = []
for i in xrange(m):
row.append(dataline[keys[i]])
data.append(row)
json_data.close()
data = np.array(data)
以下是一些示例JSON對象。正如你所看到的,第一個對象有我想要的所有五個變量,但第二個對象沒有「title」變量的數據。
{
"title": "Monster Man",
"link": "http://monsters4ever.com/tagged/rosemary%27s%20baby%20(1968)",
"userid": 130290,
"field5": "lezmer Brunch at City Winery? Who Knew? -- Grub Street Chicago\"",
"hostid": "3969937ab0a3e2db8690c482564006a7",
"time": 376541
}
{
"link": "http://www.sfgate.com/world/article/WORLD-News-of-the-Day-From-Across-the-Globe-4120318.php",
"userid": 227954, "field5": "ries « SHEfinds\"",
"hostid": "6096407936827c96fa0833f26ab33b76",
"time": 376541
}
有人能幫我嗎?
要在沒有任何JSON結構知識的情況下努力幫助您。 –
用無填寫並用找到的鍵覆蓋。 – Floris
@弗洛伊斯我不明白你的意思。 – user3287712