說我必須存儲的數據如下:數據幀
[[[{}][{}]]]
或詞典
的兩個列表的列表的列表,其中:
{}
:包含數據的字典從觀察事件的各個框架。 (有兩個觀察員/電臺,因此有兩本字典。)
[{}][{}]
:與單個事件相關的所有單個幀的兩個列表,每個觀察者/電臺一個。
[[{}][{}]]
:單夜觀察所有事件的列表。
[[[{}][{}]]]
:所有夜晚的列表。
希望這是明確的。我想要做的是創建兩個熊貓數據框,其中來自station_1
的所有字典存儲在一箇中,並且所有來自station_2
的字典存儲在另一箇中。
我的當前方法是如下(其中data
爲上述數據結構):
for night in range(len(data)):
station_1 = pd.DataFrame(data[night][0])
station_2 = pd.DataFrame(data[night][1])
all_station_1.append(station_1)
all_station_2.append(station_2)
all_station_1 = pd.concat(all_station_1)
all_station_2 = pd.concat(all_station_2)
我的理解是,雖然for循環必須效率極其低下,因爲我將縮放的這個腳本方式應用從我的樣本數據集中,這個成本很容易變得難以管理。
因此,任何意見,以更聰明的方式進行,將不勝感激!我覺得熊貓是如此的用戶友好,這是一種處理任何類型的數據結構的有效方式,但我還沒有能夠自己找到它。謝謝!
你可以試用'pd.read_json()'。 – Khris
['[[{}] [{}]]]'中的數據示例以及期望的數據幀對於測試 –
有幫助當然,我已經在此處提供了一個示例:https://www.dropbox.com /s/8b4zqq6nhzbie4p/datasample.txt?dl=0 –