0
我在git hub上找到了這個函數。如何將函數應用於熊貓數據幀組
def std_div(data, threshold=3):
std = data.std()
mean = data.mean()
isOutlier = []
for val in data:
if val/std > threshold:
isOutlier.append(True)
else:
isOutlier.append(False)
return isOutlier
我想這適用於我的數據幀的每個組(部門)
employee_id dept Salary
1 sales 10000
2 sales 110000
3 sales 120000
4 hr 5000
5 hr 6000
這工作,但它計算整個數據幀的STD股利。
df["std_div"]= df.from_dict(std_div(df.Salary))
你的函數計算多個項目。你只想要std?試試'df.groupby(['dept'])['Salary']。agg('std')' – Parfait