我上一個數據幀DF使用df.describe()
導致:比較2個dataframes得到另一個數據幀
Index count mean std min 25% max
ABC 6 5.14 4.63 1 2 12
CDE 6 18.6 12.5 2 7.5 15
DEF 7 30.2 32.6 1 6.5 20
另據幀DF2
Index Date eventName eventCount
0 2017-08-09 ABC 24
1 2017-08-09 CDE 140
2 2017-08-10 CDE 150
3 2017-08-11 DEF 200
凡門檻列應該是計算公式如下:
例如,對於eventName:ABC使用日期:2017-08-09(每日)在數據框中df2作爲此新數據幀中的新索引,日期的偏差百分比爲:2017-08-09要存儲在這個新的數據幀將在EVENTCOUNT列在數據幀代表ABC DF2的值:其是24減去在數據幀DF 其中是代表ABC 1 分鐘列中的值太:24-1 = 23,然後除以ABC的eventCount值df2 *(100),即23/24 * 100 = 95%
生成的(新)數據幀應該如下所示:
Index eventName eventCount threshold min
2017-08-09 ABC 24 Under 95% 1
2017-08-09 CDE 140 Under 98.5% 2
2017-08-10 CDE 150 Under 99.3% 2
2017-08-11 DEF 200 Under 99.5% 1
我已經卡住了,我該怎麼辦?
*我被困已經* ......堅持了什麼?你的嘗試代碼在哪裏? SO不是代碼寫入服務。 – Parfait