2009-08-13 216 views
1

如何計算一組數據的平均值,同時對超出「標準」範圍的任何點進行平滑處理。這是一段時間,因爲我不得不做任何真正的數學,但我敢肯定,我知道這個地方...銷售數據的平滑平均值

可以說我有一個項目的銷售數據12天:2,2,2,50, 10,15,9,6,2,0,2,1

我想計算每天的平均銷售額,但不允許第4天(50)將平均數過高。日誌,百分點,這樣的東西我認爲...

+1

我所有的統計教師都教過我,我們不應該因爲不符合要求而刪除數據。不過,我仍然會馬上答覆馬特的回答。 – mcandre 2009-08-13 18:52:19

+0

是的,你絕對不想刪除數據。 12天的平均值是50美元,是平均值的一部分。您也可能對該數據集的平均銷售額爲2而感興趣,而平均值爲8.4。 – 2009-08-13 18:56:07

+0

如果您將平均值用作未來銷售額的預測值,刪除異常值是完全正常的。 – 2009-08-13 18:58:13

回答

5

這聽起來對你而言,你正在尋找一個moving average

+0

啊!完美,我知道它有一個名字。 – 2009-08-13 19:00:54

1

您也可以通過閾值的某些倍數的標準偏差進行過濾。這將過濾掉比平均值(平均值)遠遠超出預期的結果。

標準偏差只是sqrt(sum(your_values - average_value)/ number_of_values)。

編輯:你也可以看看通過偏離平均值來衡量值。因此,非常大的值可以被加權爲1/exp(偏差),因此貢獻遠離它們的平均值的距離要小得多。

1

你會想要使用像IQR(interquartile range)。基本上,你將數據分成四分位數,然後計算第一和第三四分位數的中位數。那麼你可以得到你的數據集中趨勢。