我已經繼承了一些調用Web API的代碼,並獲得了深度嵌套(最多8層)響應。HDF5是一種合適的技術來存儲JSON數據嗎?
我寫了一些代碼來扁平化結構,以便它可以寫入.csv文件和SQL數據庫,供人們更容易地使用。
我真的很想做的事情就是保留原始響應的一個版本,以便有原始結構的參考,如果我想要/需要的話。
據我所知,HDF5主要是爲了存儲數字數據。有沒有任何理由不使用它來轉儲JSON斑點?看起來比設置NoSQL數據庫容易得多。
我已經繼承了一些調用Web API的代碼,並獲得了深度嵌套(最多8層)響應。HDF5是一種合適的技術來存儲JSON數據嗎?
我寫了一些代碼來扁平化結構,以便它可以寫入.csv文件和SQL數據庫,供人們更容易地使用。
我真的很想做的事情就是保留原始響應的一個版本,以便有原始結構的參考,如果我想要/需要的話。
據我所知,HDF5主要是爲了存儲數字數據。有沒有任何理由不使用它來轉儲JSON斑點?看起來比設置NoSQL數據庫容易得多。
決定設置Mongo數據庫比較容易。
應該沒問題。這聽起來像你將每個JSON響應存儲爲一個HDF5可變長度字符串。這很好,它只是圖書館的一個字符串。
您是否計劃將每個響應存儲爲單獨的數據集?如果你正在談論大於1000的答案,這可能是低效的。
或者,您可以創建一維可擴展數據集,並在每個響應中附加它。
我根本不會推薦。首先,如果你使用可變長度的字符串,你的h5文件將會大得多,你會期望的。我真的很驚訝。其次,hdf5專爲存儲數字數據而設計。對於JSON,我會推薦MongoDB,因爲它主要是爲JSON設計的,它有很多你會喜歡的功能。運行它非常容易。如果你使用docker而不是'docker run -d mongo'將會完成這項工作。如果你不喜歡碼頭工人,你可以用很少的命令來設置它... – ziky