我通過連接到某些API的腳本創建了超過500 000個JSON文檔。我想將這些文檔導入到RethinkDB中,但似乎RethinkDB不能大量導入文件,所以我想將所有這些文件合併成一個大的JSON文件(比如bigfile.json)。這裏是它們的結構:如何合併成千上萬的json文檔?
文件1.json:
{
"key_1": "value_1.1",
"key_2": "value_1.2",
"key_3": "value_1.3",
...
"key_n": "value_1.n"
}
文件2.json:
{
"key_1": "value_2.1",
"key_2": "value_2.2",
"key_3": "value_2.3",
...
"key_n": "value_2.n"
}
...
文件n.json:
{
"key_1": "value_n.1",
"key_2": "value_n.2",
"key_3": "value_n.3",
...
"key_n": "value_n.n"
}
我想知道這會是創建一個大JSON文件的最佳結構(要完整,每個文件都有一個由3個變量組成的特定名稱,第一個是tim estamp(YYYYMMDDHHMMSS)),以及哪個命令或腳本(直到現在我只爲bash寫腳本...)才能讓我產生合併。
輸出文件應該如何查看?文件的名稱與它有什麼關係 - 爲什麼這很重要?它出現在文件中還是應該出現? –
輸出將是一個很大的json文件。我想過看起來像{「bigfile」:[file_1,file_2,...,file_n]}的東西,但我不知道它是否是大文件的最佳結構(輸出會超過1千兆)。這些文件的名字沒有出現在這些文件中,但我想也許我應該讓它們出現在大文件中,因爲它們部分地描述了輸入文件。 – crocefisso
你沒有太大的幫助。 'yes> file.json'生成一個很大的JSON文件。 –