我有一個數據幀「東風」,看起來像這樣:Python的熊貓數據幀的GroupBy大小根據病情
id date1 date2
1 11/1/2016 11/1/2016
1 11/1/2016 11/2/2016
1 11/1/2016 11/1/2016
1 11/1/2016 11/2/2016
1 11/2/2016 11/2/2016
2 11/1/2016 11/1/2016
2 11/1/2016 11/2/2016
2 11/1/2016 11/1/2016
2 11/2/2016 11/2/2016
2 11/2/2016 11/2/2016
我想這樣做是爲了GROUPBY的ID,然後得到每個ID在該尺寸日期1 = DATE2。結果應該是這樣的:
id samedate count
1 11/1/2016 2
1 11/2/2016 1
2 11/1/2016 2
2 11/2/2016 2
我已經試過這樣:
gb=df.groupby(id').apply(lambda x: x[x.date1== x.date2]['date1'].size())
而得到這個錯誤:
TypeError: 'int' object is not callable
你肯定會標誌中的每個實例,其中日期1和date2相等,然後每個相同的日期計算每個ID的標誌,但我必須相信有一個groupby選項。
感謝您的 時間。這是一個更好的方法。 – Zero
謝謝你的回答,第一個想法與你的答案非常相似。 – jezrael
謝謝。優秀! – clg4