計數記錄我有在Python(〜10^6條)的相對大的數據幀,構成爲這樣:的Python /大熊貓:分組和由日期和ID
Index,Date,City,State,ID,County,Age,A,B,C
0,9/1/16,X,AL,360,BB County,29.0,negative,positive,positive
1,9/1/16,X,AL,360,BB County,1.0,negative,negative,negative
2,9/1/16,X,AL,360,BB County,10.0,negative,negative,negative
3,9/1/16,X,AL,360,BB County,11.0,negative,negative,negative
4,9/1/16,X,AR,718,LL County,67.0,negative,negative,negative
5,9/1/16,X,AR,728,JJ County,3.0,negative,negative,negative
6,9/1/16,X,AR,728,JJ County,8.0,negative,negative,negative
7,9/1/16,X,AR,728,JJ County,8.0,negative,negative,negative
8,9/1/16,X,AR,728,JJ County,14.0,negative,negative,negative
9,9/1/16,X,AR,728,JJ County,5.0,negative,negative,negative
...
我通過日期試圖組(天)和ID,然後計算1)每天和ID的記錄總數,以及2)每天和ID中「A」列(例如)的「正數」總數。最後,我想填充數據幀表示肯定和對每一天,ID,例如記錄總數的數量,
Date,ID,Positive,Total
9/1/16,360,10,20
9/2/16,360,12,23
9/2/16,718,2,43
...
我原來使用的雙for循環,通過每一個獨特的那一天,和身份證,但這需要太多時間。我希望能有更好的方法幫助。預先感謝您的任何意見!
看進入Pandas文檔中的'groupby'。 –
我試過這個,但是我不能讓它做我想做的。 – jtam