我有一個由成千上萬個條目,如下面的數據集:如何從Python中的多個字符串提取多個數據點?
[{'country': {'id': '1A', 'value': 'Arab World'},
'date': '2016',
'decimal': '0',
'indicator': {'id': 'SP.POP.TOTL', 'value': 'Population, total'},
'value': None},
{'country': {'id': '1A', 'value': 'Arab World'},
'date': '2015',
'decimal': '0',
'indicator': {'id': 'SP.POP.TOTL', 'value': 'Population, total'},
'value': '392168030'},
{'country': {'id': '1A', 'value': 'Arab World'},
'date': '2014',
'decimal': '0',
'indicator': {'id': 'SP.POP.TOTL', 'value': 'Population, total'},
'value': '384356146'},
.... 17020十歲上下行後.....
{'country': {'id': 'XH', 'value': 'IDA blend'},
'date': '1960',
'decimal': '0',
'indicator': {'id': 'SP.POP.TOTL', 'value': 'Population, total'},
'value': '163861743'},
...]
我想創建一個DataFrame使用pandas使得y軸='id'和x軸='日期',其中'值'是存儲值。我想不出用什麼辦法來解決這個問題......
編輯: 想象一張只有數字(來自數據集的'價值')的工作表。 x軸列將是提取日期,y軸行將是國家id('id')。最終的對象將是一個大小爲y * x的數據集。這些數字都是'float'類型。
編輯2: 數據集代表1960年至2016年的304個國家,因此數據集中大約有304 * 56 = 17024個條目。我需要針對每個國家和日期存儲'值'(條目2的值,值= 392168030)。
編輯3: 使用上面的數據,一個例子輸出數據集將正是如此結構:
2016 . 2015 . 2014 . ... 1960
1A . None . 392168030 384356146 . ... w
...
XH . x y z 163861743
你能隨你怎麼指望數據看起來像在Excel或任何其他表格格式編輯您的問題嗎?你想如何處理'indicator'或'decimal'有點不清楚。 –
@ Fomalhaut-C而不是解釋你想要什麼,你能展示一個期望輸出應該是什麼的例子嗎? – spies006