2014-04-17 91 views
0

想象我有一個表是這樣的:數學統計,如何計算預知

month-year varchar 
nbr integer 

值:

[01-2014,5],[02-2014,110],[03-2014,154],[04-2014,110] 

想象我們是4月15日。 此數據顯示在線性圖上。 如果我顯示4月份的實際值,則線將會下降。 我想顯示的是當前月份的趨勢而不是實際值。

我因子評分這樣做這樣的事情:

(5+110+154+110)/(3 + (15/30.5)) = 108 

其中「3」是月的數量過去了,「30.5」是一個月的平均天數,「15」是多少本月通過的日子。 這是錯誤的,因爲它低於實際值。

我很確定有一個更正式的方法來做到這一點,但正如你所看到的,我對統計和趨勢瞭解不多。我嘗試過其他方法,但他們不太有說服力。

你能幫我嗎?

注意:實際上我可以在一天之內得到計數,甚至可以是幾小時或幾分鐘。 我只是計數在mysql的條目數量,我有一個日期時間列。 爲了讓我自己明白這個例子的目的,我用月份和年份描述了表格。

回答

1

你正在計算的是一個移動平均值。

你的計算中有一個小小的錯誤。公式應該是:

(5+110+154+110)/(3 + (15/30.5)) 
         ^^^^^^^ 

你需要決定多少個月回到你的移動平均線,包括。

+0

謝謝你,我編輯了我的問題^^ - 如果我只需要一兩個月的時間,結果就是我期望的結果,這是真的。但是這樣做是正確的嗎? – Su4p

+1

您使用的時間越少,值越「真實」。但是,如果日常數值有自然變化,那麼從幾天的時間推算整個月就可能產生很大的誤差。我建議您使用過去30天來估算當前月份。它應該工作得很好,除非有大的季節變化。它將做的是用上個月的天數替換本月的剩餘日期。 –

+0

如果我花了兩個月的時間,結果將是149.6,但它比我預期的要低,原因是上個月在同一天的參賽人數是154/2 = 77。 – Su4p