2009-11-25 19 views
0

我正在尋找一種工具,可以讓我生成具有某些統計屬性的數據集。例如,假設我想生成一百萬個具有x個異常值的整數用於測試。如何生成準隨機統計數據集?

是否有任何工具可以生成像這樣的測試數據集?我不一定需要任何花哨的東西,只是一些基本的功能。

回答

1

Math from apache commons有一些工具可以用來從簡單的概率分佈生成數據。實際上,使用你所使用的任何系統的random()函數,這些生成函數的roll your own variant非常容易。假設random()返回一個介於0和1之間的均勻分佈的隨機數,那麼只需通過你需要的任何分佈的inverse cumulative distribution function即可得到你需要的隨機數。如果你需要非常喜歡的東西,你可以使用Markov Chains