0
在下面的表中,我試圖找到「案件數」爲SUM(「案件數」)的比例爲各佔通過列值除以單元格值列在不同的數據表
Make | age | mileage | Test Result | Number of Cases
0 ABARTH 0-3 <10,000 P 6
1 ABARTH 0-3 <50,000 P 23
2 ABARTH 0-3 <50,000 F 2
3 ABARTH 0-3 <50,000 PRS 1
4 ABARTH 0-3 <100,000 P 2
5 ABARTH 0-3 <100,000 F 1
6 ABARTH 3-5 <10,000 P 5
7 ABARTH 3-5 <50,000 P 77
所以我分組表如下:
Make Number of Cases
ABARTH 139
AC 30
AC (ELECTRIC) 33
ACCESS 7
使用循環和追加我所需要的值嘗試過,但沒有結果,因爲我敢肯定,我使用附加功能失常:
rate = pd.Series()
for index, row in pass_rates.iterrows():
rate.append(row['Number of Cases']/test_makes[test_makes['Make'] == row['Make']])
一個返回的對象是一個空系列
所以基本上我要找應該是這樣的
Make | age | mileage | Test Result | %
0 ABARTH 0-3 <10,000 P 0.043
1 ABARTH 0-3 <50,000 P 0.165
2 ABARTH 0-3 <50,000 F 0.014
謝謝,但我收到此錯誤:TypeError:'DataFrame'對象不能在第2行調用 –
您的total_cases是Series或DataFrame嗎?你可以打印'type(total_cases)'的結果來找出結果。當我運行代碼時,它是一個Series,可以通過'map'調用,但是你的錯誤表明你獲得了一個DataFrame。你在'groupby'中做了什麼不同的事情,會導致它返回一個DataFrame而不是一個Series? – root
是的,你說得對,我現在正在工作 –