我想創建一個彙總表如下:如何獲得非數值數據的summay在Python
A=
ID Date C1 C2
X 12/01/15 A House
X 18/04/15 B Rent
X 21/08/15 A Rent
Y 01/08/15 C Rent
Y 21/12/15 C House
B=
ID C1 C2 Data
X 3 House 12/01/15
Y 2 Rent 01/08/15
C=
ID C1 C2 Date
X 3 Rent 21/08/15
Y 2 House 21/12/15
它所做的是,每個ID,它計算數據條目的數量(行),在B
的第C2
列下放入第一個入口,並在C
放入最後一個入口。
我可以使用groupby
功能並獲得計數,但不知道如何使列C2
。
B = pd.DataFrame(A.groupby('ID', sort = False).count().ix[:, 1:]).reset_index(level=1)
謝謝,這太棒了。但是,如何選擇在「C1」中計數項目,並給出「Data」和「C2」列的第一個和最後一個實例? – Ana
@Ana請參閱上面的修改回覆。 – Alexander