2017-03-22 256 views
2

docsscipy.stats.zipf中的參數是什麼意思?

爲齊普夫的概率質量函數是:

zipf.pmf(K,A)= 1 /(ζ電的(a)* K ** A) 對於k> = 1.

zipf以a作爲形狀參數。

上面的概率質量函數在「標準化」形式中定義。要移位分佈,請使用loc參數。具體而言,zipf.pmf(k,a,loc)與zipf.pmf(k - loc,a)的作用相同。

但是ak是指什麼? 「形狀參數」是什麼意思?

此外,在scipy.stats.zipf.interval中,有一個alpha參數。

.interval()方法的描述很簡單:包含通訊

的阿爾法%的什麼是alpha參數指的是一系列的

終點?那是「置信區間」嗎?

+0

相關:http://stats.stackexchange.com/questions/269255/is-it-right-to-use-normal-distribution-to-compute -confidence間隔--A-POIN的 – alvas

回答

3

「形狀參數」是什麼意思?

顧名思義,形狀參數決定了分佈的形狀。這可能是最容易啓動的時候是什麼形狀參數解釋:

  1. 一個位置參數轉移分配,但離開它,否則保持不變。例如,正態分佈的平均值是位置參數。如果X正態分佈的平均值爲mu,那麼X + a正態分佈的平均值爲mu + a

  2. A 比例尺參數使分佈變寬或變窄。例如,正態分佈的標準偏差是比例參數。如果X正態分佈的標準差爲sigma,則X * a正態分佈,標準差爲sigma * a

  3. 最後,一個形狀參數改變了分佈的形狀。例如,Gamma distribution有一個形狀參數k,它決定了分佈的偏斜程度(=它向一邊傾斜的程度)。

但到底是什麼的ak指什麼?

k是由分佈參數化的變量。使用zipf.pmf,您可以計算任何k的概率,給定形狀參數a。下面是一張圖,演示a如何改變分佈的形狀(不同k的個體概率)。

enter image description here

a使得k不太可能大的值,而低a,使小k不太可能和更大k是可能的。

alpha參數是什麼意思?那是「置信區間」嗎?

這是錯誤的說法alpha的置信區間。它是置信水平。我想這就是你的意思。例如,alpha=0.95表示您有95%的置信區間。如果您從特定發行版中隨機生成k,則其中95%將位於由zipf.interval返回的範圍內。

代碼的情節:

from scipy.stats import zipf 
import matplotlib.pyplot as plt 
import numpy as np 

k = np.linspace(0, 10, 101) 

for a in [1.3, 2.6]: 
    p = zipf.pmf(k, a=a) 

    plt.plot(k, p, label='a={}'.format(a), linewidth=2) 

plt.xlabel('k') 
plt.ylabel('probability') 

plt.legend() 
plt.show()