2016-05-02 287 views
1

從以下數據集: enter image description here熊貓.groupby自動selecing列

我試圖用.groupby創建一組從哪裏獲得每用戶位置的平均狀態計數。我已經通過使用

groupLoc = df.groupby('User Location') 
groupCount = groupLoc.mean() 
groupCount 

自動選擇了用戶位置和跟隨者計數。現在我正在嘗試爲用戶位置和狀態計數做同樣的事情,但它會再次自動包含跟隨者計數。

enter image description here

任何人都知道如何解決這一問題?提前致謝!

回答

1

我認爲你需要groupbymean

print df.groupby('User Location', as_index=False)['Follower Count'].mean() 
    User Location Follower Count 
0   Canada  1654.500000 
1   Chicago  9021.000000 
2  Indonesia  1352.666667 
3   London  990.000000 
4 Los Angeles CA  86.000000 
5   New York  214.000000 
6  Singapore  106.500000 
7   Texas  181.000000 
8    UK  2431.000000 
9  indonesia  316.000000 
10   null  295.750000 

print df.groupby('User Location', as_index=False)['Status Count'].mean() 
    User Location Status Count 
0   Canada 39299.000000 
1   Chicago 6402.000000 
2  Indonesia 12826.000000 
3   London 4864.666667 
4 Los Angeles CA 3230.000000 
5   New York 2947.000000 
6  Singapore 6785.500000 
7   Texas 901.000000 
8    UK 81440.000000 
9  indonesia 17662.000000 
10   null 29610.875000 
+0

工作就像一個魅力!謝謝 – user3394131

+0

超級,我嘗試'as_index = False'來改進解決方案,以返回'DataFrame'。 – jezrael