我是Python新手,需要您的幫助。我需要計算一個非常大的數組中特定列的平均值。我想用numpy.average功能(開放給任何其他建議),但不能想出一個辦法,通過其標題來選擇列(例如平均爲Flavor_Score列):計算2D陣列中特定列的平均值
Beer_name Tester Flavor_Score Overall_Score
Coors Jim 2.0 3.0
Sam Adams Dave 4.0 4.5
Becks Jim 3.5 3.5
Coors Dave 2.0 2.2
Becks Dave 3.5 3.7
我必須轉置陣列(似乎還有很多功能在大熊貓和numpy的,但行相對較少的列(我可能是錯的,當然),以獲得平均計算中做了列?
爲同第二個問題數組:是使用第一個問題的答案(計算平均Flavor_Score)來計算特定啤酒的平均Flavor_Score(不同測試者之間)的最佳方式)?
啤酒測試= 「庫爾斯」
因爲我在Beer_Name():
if i=Beer_test: # recurring average calculation
else: pass
我希望有一個內置的功能這一點。
非常感謝您的幫助!
計算特定列的平均值df ['Flavor_Score']。mean()',對於特定啤酒:'df [df ['Beer_Name'] =='Coors','Flavor_Score']。mean ()' – EdChum
mean()OR average()? – Toly
@EdChum - 代碼的第一行工作完美! MEAN函數是計算平均值還是平均值?第二行代碼產生了一個錯誤它不喜歡df [df ['Beer_Name'] ...並且我用df替換了它[df.beer_name ==「Coors」]。Flavor_Score.mean()它工作正常!謝謝你,EdChum! – Toly