說的百分比,我有這樣的數據:熊貓 - 數組大小
col1 col2 other columns..
0 0 ...
0 0 ...
0 0 ...
0 0 ...
0 0 ...
0 0 ...
0 0 ...
0 0 ...
0 0 ...
0 0 ...
0 1 ...
0 1 ...
0 1 ...
0 1 ...
0 1 ...
0 1 ...
1 0 ...
1 0 ...
etc...
數據已經由2列(它已經由分類結果)進行分組:
gr = df.groupby(['col1', 'col2']).size()
col1 col2
0 0 10
1 5
1 0 2
1 16
2 0 10
所以現在我需要弄清楚每個小組中有多少個百分比,每個小組的計數有兩列:
我需要再添加一列,或者轉換爲系列(更好)以獲得col2的百分比。 y中的基團(COL1),如:
col1 col2
0 0 0.66
1 0.33
1 0 0.1
1 0.9
2 0 1
或者也可以爲每個組獨立的系列:[0.66 0.1 1]
和[0.33 0.9]
。 如何實現它?
那麼讓我來描述這個數據的含義。例如,它可以是科目(0,1,2),結果(0或1)以及每個科目每個科目的學生數量。 因此,整個想法是弄清楚爲什麼百分比的學生不合格/通過科目0,1等
另外一件事 - 有時只有一個結果(0或1)像所有學生的主題過去了,我仍然需要能夠告訴爲0這個問題比例0,0和1是1
非常感謝您的回覆。但我相信我描述了錯誤的任務,讓我添加更多細節並糾正錯誤。我很抱歉。請查看更新後的問題。 – mimic
解決方案已更改,請檢查它。 – jezrael
非常感謝jezrael – mimic