以下是1個Python腳本的輸出:
多詞典 - 對於所有相同的密鑰,做一些聚集
{ 12: {'@': False, '#': False, 'word': 'good#1st#time#will', 'longword': True, 'title': False, 'charcount': 18, 'uppercase': False, 'stop': False, 'sscore': False, 'url': False, '!!!': False} }
{ 12: {'@': False, '#': False, 'word': 'be', 'longword': False, 'title': False, 'charcount': 2, 'uppercase': False, 'stop': True, 'sscore': False, 'url': False, '!!!': False} }
{ 12: {'@': False, '#': False, 'word': 'going', 'longword': False, 'title': False, 'charcount': 5, 'uppercase': False, 'stop': False, 'sscore': False, 'url': False, '!!!': False} }
{ 13: {'@': False, '#': False, 'word': 'back#', 'longword': False, 'title': False, 'charcount': 5, 'uppercase': False, 'stop': False, 'sscore': False, 'url': False, '!!!': False} }
{ 13: {'@': False, '#': False, 'word': 'http://instagr.am/p/rx9939civ8/\xc2\xa0', 'longword': True, 'title': False, 'charcount': 33, 'uppercase': False, 'stop': False, 'sscore': False, 'url': True, '!!!': False} }
在另一個python腳本,上述被作爲輸入。所有上面的代碼是不同的字典是1腳本的輸出,但在另一個腳本中,我想要做一個'charcount'或計數longword = True的數字,這些多字典具有相同的鍵,因此輸出如下所示:
{ 12: {'longword': 1 ,'charcount': 25} }
{ 13: {'longword': 1 ,'charcount': 38} }
我的數據集不組他們,但輸出單個字典12作爲密鑰和13作爲關鍵字。我的代碼應該能夠找到所有相同的密鑰,因爲我有一個大的數據集,並進行上述聚合
這是我的代碼,它將上述作爲多字典,但我不明白我將如何做聚合。
dicts = {}
for line in sys.stdin:
d = ast.literal_eval(line)
for k,v in d.items():
dicts.setdefault(k, []).append(v)
for key,val in v.items():
這是我到目前爲止的代碼。
是外字典排序?換句話說,你的數據集是不是所有的'12'行,然後是所有'13'行等? –
我也必須按鍵排序詞典。我的數據集不會對它們進行分組,但會輸出單個字典,其中12個爲關鍵字,13個爲關鍵字。 我的代碼應該能夠找到所有相同的密鑰,因爲我有一個大數據集並執行上述聚合。 – fscore