2011-07-07 157 views
2

我每天有零至多次預訂,而且我需要衡量這些預訂在整個我的時間段內的分佈情況。預訂可以是半天或全天預訂。均勻性測試的快速算法

我在這種情況下考慮的時間段爲一個月。

我的數據有很大的差距:在一個月內,我可能只有高達25-50%的預訂天數。

我需要一個算法,它會給我一個數字(任意單位,我不在乎:我只是比較許多排列和選擇最均勻的),它代表預訂的一致性。

最重要的是,我需要它非常快,因爲我將運行它數百次。

我已經看過安德森 - 達林測試,克拉默-CON-米塞斯和柯爾莫哥洛夫 - 斯米爾諾夫測試,但是這些所有檢查數據是否符合任何分佈。我確信有一個更快的算法來確定數據是否完全一致。

我編碼在C#

+0

如果您只關心「統一」的相對順序,您可以找到預訂之間的差距的RMS。一個真正的均勻分佈應該具有最低的RMS(假設在固定時間內固定數量的預訂)。 – bdares

回答

1

我希望我不是非常簡單化你的問題,但我相信你真正想知道的是你的差距的variance。有一個set of algorithms計算方差,每個都有自己的屬性,所有這些都很快。

+0

是的,這是我目前使用的方法。我希望有一種算法使用一些數學屬性,這使得我們可以快速移動數據點,以計算單個循環中的間隙和差異。 – Ozzah