我需要從一個.json文件導入的數據集中額外添加一個要素。從熊貓數據框中提取字典值
這是什麼樣子:
f1 = pd.read_json('https://raw.githubusercontent.com/ansymo/msr2013-bug_dataset/master/data/v02/eclipse/short_desc.json')
print(f1.head())
short_desc
1 [{'when': 1002742486, 'what': 'Usability issue...
10 [{'when': 1002742495, 'what': 'API - VCM event...
100 [{'when': 1002742586, 'what': 'Would like a wa...
10000 [{'when': 1014113227, 'what': 'getter/setter c...
100001 [{'when': 1118743999, 'what': 'Create Help Ind...
從本質上說,我需要「SHORT_DESC」作爲列名,並用字符串值正下方填充它:「可用性問題...
到目前爲止,我已經試過如下:
f1['desc'] = pd.DataFrame([x for x in f1['short_desc']])
Wrong number of items passed 19, placement implies 1
是否有一個簡單的方法來做到這一點,而不使用循環?有人能指出這個新手朝着正確的方向嗎?
這就是讓我瘋狂的原因,爲什麼我們得到了1,10,100等等,沒有'short_desc'和列標題。 – JohnWayne360
@ JohnWayne360因爲你正在打印一系列作品。嘗試'print(df.head())'。你會得到它。 –
@ JohnWayne360有趣的是,當你從網頁鏈接加載它時,該索引似乎就出現了。想要重置它?做'f1 = f1.reset_index(drop = 1)' –