2016-06-30 129 views
-2

我目前在頂部有數據框。有沒有辦法使用groupby函數來獲取另一個數據框來分組數據,並將這些單詞連接成如下進一步使用Python熊貓的格式?如何使用groupby連接python熊貓中的字符串?

感謝

[enter image description [1]

+0

也有同樣的問題在這裏:HTTP:/ /stackoverflow.com/questions/17841149/pandas-groupby-how-to-get-au nion-of-strings – johnchase

回答

6

可以groupby後你的專欄申請join

df.groupby('index')['words'].apply(','.join) 

例子:

In [326]: 
df = pd.DataFrame({'id':['a','a','b','c','c'], 'words':['asd','rtr','s','rrtttt','dsfd']}) 
df 

Out[326]: 
    id words 
0 a  asd 
1 a  rtr 
2 b  s 
3 c rrtttt 
4 c dsfd 

In [327]: 
df.groupby('id')['words'].apply(','.join) 

Out[327]: 
id 
a  asd,rtr 
b    s 
c rrtttt,dsfd 
Name: words, dtype: object 
+0

謝謝Edchum,我試圖從groupby轉換系列,你已經幫助回到一個數據框,所以我可以做一個合併,但我有這樣做的問題,因爲我沒有列名連接的項目。我如何添加列名稱?我試圖通過使用pd.DataFrame(data = df,columns = [])變成一個數據框,但它不起作用,再次感謝任何專業知識。 – user3655574

+0

對不起,你在上面的reset_index()之後? – EdChum

+0

非常感謝您的先生!我做了df.groupby('id')['words']。apply(','。join).reset_index()然後df1 = pd.DataFrame(data = df,columns = ['id','words' ]),它的工作原理! – user3655574