我最近在Python中選擇了編程,並且正在創建數據庫。搜索數百萬個JSON文件的最佳方式是什麼?
我已經制定出從他們的源提取所有這些文件,所以他們都在我的電腦上的目錄。
所有這些文件結構相同的方式,我想要做的就是搜索這些多維詞典,並找到一組特定的鍵的值。
這些JSON文件全部結構相似,
{
"userid": 34535367,
"result": {
"list": [
{
"name": 264,
"age": 64,
"id": 456345345
},
{
"name": 263,
"age": 42,
"id": 364563463456
}
]
}
}
在我的情況,我想搜索「姓名」鍵和返回相關的數據(質量,標識和原始用戶標識符)成千上萬的名稱,就像它從我的數百萬個JSON文件中獲得的一樣。
基本上我很新,並且我擁有的小編程知識是Python。我很高興開始學習我需要的任何東西,但我不確定要走向哪個方向。
有沒有任何理由爲什麼這些數據是以百萬計的JSON文件而不是一個合適的數據庫? – NullUserException
我不得不通過網絡API調用所有它,現在濾出了大概1億個選項,現在我有200萬個文件。 – user2942213
根據您不得不查詢和更新數據的頻率,最好將其插入數據庫。 – NullUserException