2
我的老闆需要我們的票務處理系統的指標,他希望的指標之一是「90%的時間」,他將其定義爲需要處理90%票據的時間。我猜他認爲有10%是異常的可以忽略。我希望這至少能夠達到一些統計的有效性。所以我列出了我投入numpy數組的時間列表。這是我想出的代碼。找到處理90%票的時間?
import numpy as np
inliers = data[data<np.percentile(data, 90)]
ninety_time = inliers.max()
這是有效的嗎?有沒有更好的辦法?
是你累計還是遞增的次數? –
@ Ev.Kounis增量。處理1張票的時間是陣列中的一個條目。 –
我能想到的最*統計正確*的過程是獲得時間列,隔離它,對它進行排序,從正面和背面消除等量的條目(最快和最慢的條目; 0.05 * len(數組)',從而使你最終得到總數的90%),然後只剩下剩下的東西。 –