2016-10-26 65 views
2

我有兩列的表,我想文本具有相同id結合如何合併文本行的熊貓

import pandas as pd 
df = DataFrame({'id':[101453,101465,101478,101453,101465,101465], 'text' :['this','is','a','test','string','one']}) 

我需要這樣一個結果:

df = DataFrame({'id':[101453,101465,101478], 'text':['this test','is string one','a']}) 

回答

2

使用groupbyapplyjoin

print (df.groupby('id')['text'].apply(' '.join).reset_index()) 
     id   text 
0 101453  this test 
1 101465 is string one 
2 101478    a 
1
df['id'] = sorted(list(set(df['id']))) 

set()刪除所有相等的元素。然後將它返回給list()。並根據需要進行分類。