我試圖從Scipy軟件包實施雙樣本Kolmogorov-Smirnov測試以測試是否存在差異兩個樣本。樣品是在兩個不同時期出售的T恤尺碼(S,M,L,XL和XXL)。我想測試這兩個時期的尺寸分佈是否有所不同。雙樣本Kolmogorov-Smirnov測試,原始數據與預先計算的百分比數據之間的結果差異
我遇到的問題是,當我預先計算每個大小的總數百分比與使用原始數據相比時,我得到的結果非常不同。我不明白這一點,因爲百分比仍然代表相同的分配。
這裏是我使用的代碼(x和y是原始數據,X1和Y1是計算的百分比):
from scipy.stats import ks_2samp
x = (254, 526, 576, 622, 409)
y = (92, 214, 366, 365, 287)
x1 = (10.6, 21.9, 24.0, 25.9, 17.1)
y1 = (7.0, 16.2, 27.7, 27.7, 21.7)
print(ks_2samp(x, y))
print(ks_2samp(x1, y1))
而且這些都是我得到兩個不同的結果:
Ks_2sampResult(統計量= 0.80000000000000004,p值= 0.03614619076928504) Ks_2sampResult(統計量= 0.40000000000000002,p值= 0.69740487802059081)
謝謝你的答案,爲我澄清了它。 – DavidK11