我從dynamodb表中獲取數據,使用boto3 for python 2.7,我會使用熊貓來對數據進行分組和排序。使用python的大熊貓來處理aws dynamodb數據
不幸的是,dynamodb數據格式相當複雜。像這樣:
data = [{
u 'permaname': {
u 'S': u 'facebook'
},
u 'uuid': {
u 'S': u '4b873085-c995-4ce4-9325-cfc70fcd4040'
},
u 'tags': {
u 'L': []
},
u 'type': {
u 'S': u 'xxxxxx'
},
u 'createdOn': {
u 'N': u '1502099627'
},
u 'source': {
u 'S': u 'xxxxxxx'
},
u 'data': {
u 'NULL': True
},
u 'crawler': {
u 'S': u 'xxxxxxx'
}
}, {
u 'permaname': {
u 'S': u 'facebook'
},
u 'uuid': {
u 'S': u '25381aef-a7db-4b79-b599-89fd060fcf73'
},
u 'tags': {
u 'L': []
},
u 'type': {
u 'S': u 'xxxxxxx'
},
u 'createdOn': {
u 'N': u '1502096901'
},
u 'source': {
u 'S': u 'xxxxxxx'
},
u 'data': {
u 'NULL': True
},
u 'crawler': {
u 'S': u 'xxxxxxx'
}
}]
要做我的小組和排序的東西,我必須創建一個熊貓物體,我不知道該怎麼做。
這是我正在努力:
obj = pandas.DataFrame(data)
print list(obj.sort_values(['createdOn'],ascending=False).groupby('source'))
如果我打印的obj是這樣的:
print list(obj)
我:
[u'crawler 'U' createdOn',u'data',u'permaname',u'source',u'tags', u'type',u'uuid']
有人知道如何用dynamodb數據創建dataFrame obj嗎?