我有一個約200,000個實體的列表,我需要爲這些實體中的每一個查詢特定的RESTful API,最後以所有以JSON格式保存的200,000個實體txt文件。 這樣做的天真的方式是通過200,000個實體的列表並逐個查詢,將返回的JSON添加到列表中,並在完成時將所有內容都添加到文本文件中。喜歡的東西:向文本文件寫入大量查詢
from apiWrapper import api
from entities import listEntities #list of the 200,000 entities
a=api()
fullEntityList=[]
for entity in listEntities:
fullEntityList.append(a.getFullEntity(entity))
with open("fullEntities.txt","w") as f:
simplejson.dump(fullEntityList,f)
顯然,這是不可靠的,200000個查詢到API將需要大約10個小時左右,所以我想它得到其寫入文件之前,事情會導致錯誤。 我想正確的方法是把它寫成塊,但不知道如何實現它。有任何想法嗎? 另外,我不能用數據庫做到這一點。
你可以在工作隊列上稍微擴展一點嗎?使用哪些模塊?鏈接到文檔? – leonsas
該鏈接已經在那裏......並且該模塊被稱爲「隊列」 – wim