我有一組列表和一些基本統計數據(項目數,最小值,最大值,平均值,stddev)。我想計算所有組合的統計數據。計算總數,最小最大值和平均值很容易,但我不確定如何計算總標準偏差。找到偏差/元素列表的標準偏差
的數據是這樣的:
Count Max Min Mean Stddev
1,027,671 781 68 57.8 32.79
839,473 552 54 61.3 48.53
3,012,102 890 41 64.9 41.92
生成所有集合在一起的統計:
4,879,246 890 41 62.8 ???
每套都是在單獨的機器上計算。我必須通過網絡發送所有這些數據,這在我的應用程序中是不可接受的。 – charliehorse55
您只需發送彙總信息的三次計數,總和和平方以計算計數/平均值/標準偏差。平方和只是一個比標準開發更易計算的統計量,因爲它是通過加法結合的。他們有雙重連接,如果你知道count,sum和std dev,你可以得到count,sum和sum squares,反之亦然。 –
我打算使用它。如果你想要,你可以提交它作爲答案。 – charliehorse55