我有一系列數據,這些數據是通過分子動力學模擬獲得的,因此在時間上是連續的並且在一定程度上相關。我可以將平均值計算爲數據的平均值,我想估計與這種方式計算的平均值相關的誤差。統計無效率(塊平均值)
根據this book我需要計算「統計無效率」,或粗略地說,該系列數據的相關時間。爲此,我必須將系列分成不同長度的塊,並對每個塊長度(t_b)分塊平均的方差(v_b)。那麼,如果整個序列的方差是v_a(即,當t_b = 1時的v_b),則必須獲得(t_b * v_b/v_a)的極限,因爲t_b趨於無窮大,並且這是無效率s 。
然後,平均值中的誤差是sqrt(v_a * s/N),其中N是點的總數。所以,這意味着每個點只有一個是不相關的。
我認爲這可以用R完成,也許有一些包已經做了,但我是R新手。誰能告訴我該怎麼做?我已經發現如何讀取數據系列並計算均值和方差。
數據樣本,如要求:
# t(ps) dH/dl(kJ/mol)
0.0000 582.228
0.0100 564.735
0.0200 569.055
0.0300 549.917
0.0400 546.697
0.0500 548.909
0.0600 567.297
0.0700 638.917
0.0800 707.283
0.0900 703.356
0.1000 685.474
0.1100 678.07
0.1200 687.718
0.1300 656.729
0.1400 628.763
0.1500 660.771
0.1600 663.446
0.1700 637.967
0.1800 615.503
0.1900 605.887
0.2000 618.627
0.2100 587.309
0.2200 458.355
0.2300 459.002
0.2400 577.784
0.2500 545.657
0.2600 478.857
0.2700 533.303
0.2800 576.064
0.2900 558.402
0.3000 548.072
...這一直持續到500個PS。當然,我需要分析的數據是第二欄。
你可以發佈你創建的幾行示例數據嗎?這將幫助我們創造更好的解決方案。 – TARehman