2017-01-16 37 views
0

我有一個數據幀(如下所示)計數的數據幀

A,B,C,D 
X1,desc,may 1, 1 
X2,desc, june 5, 1 
Y,desc, dec 8, 2 
Y,desc, jan 4, 3 

我想看看X1,X2和Y和SUM,使數據幀如下所示:

A,B 
X1,1 
X2,1 
Y,5 

因此,對於X1的所有實例,我們將它們相加,對於X2和Y也是如此。是否有一個我不知道的有用的熊貓函數?我知道一個非常糟糕的解決方案,我可以將所有東西都提取到列表中,然後查看它是否存在,然後以這種方式求和並將其變回數據框,但我不確定是否有更好的方法來完成此操作大熊貓。本質上它就像一個聚合體。

+0

看看'groupby.sum()'函數。 –

+0

好的,謝謝!你可以groupby列A,然後使用它的總和 –

+0

但是,如果A是索引,這將如何工作?我無法調用df ['A'] –

回答

0

如果列到組由如這裏的情況下,被設定爲指標:

 B  C  D 
    A    
    X1 desc may 1 
    X2 desc june 1 
    Y desc dec 2 
    Y desc jan 3 

只需使用一組由指數如下:

df1.groupby([df1.index]).D.sum() 

其產生期望的結果:

A 
X1 1 
X2 1 
Y  5 
Name: D, dtype: int64