2013-07-23 70 views
6

SciPy的docs給使用指數作爲分發形式:SciPy的 - 統計 - 爲概率分佈的參數含義

expon.pdf(x) = lambda * exp(- lambda*x) 

然而擬合函數採用:

fit(data, loc=0, scale=1) 

而RVS函數採用:

rvs(loc=0, scale=1, size=1) 

問題1: 爲什麼extraneou的位置變量?我知道指數是更普遍分佈(伽瑪)的具體形式,但爲什麼包括未被充分利用的信息呢?即使伽瑪沒有位置參數。

問題2: 是否按照與輸入變量相同的順序輸出擬合(...)。我的意思是 如果我做的:

t = fit([....]) , t will have the form t[0], t[1] 

我應該解釋T [0]作爲形狀和T 1爲標尺。

這是否適用於所有的分佈?

什麼伽瑪:

fit(data, a, loc=0, scale=1) 

回答

4
  1. 每一個單變量的概率分佈,無論其常用的配方,可以擴展到包括位置和尺度參數。有時,這需要將分佈的支持從正/非負實數擴展到整個實數行,只有當值低於loc時,PDF值爲0。 scipy.stats這樣做是否將locscale的所有處理移動到所有分配共享的常用方法。有人建議刪除它,並使分佈像gammaloc - 無法遵循其規範的公式。然而,事實證明,如果我沒有記錯的話,有些人確實使用了非零參數loc的「移動伽馬」分佈來模擬太陽黑子的大小,而scipy.stats的當前行爲對他們來說是完美的。所以我們保持它。

  2. 如果有N形狀參數,fit()方法的輸出是形式爲(shape0, shape1, ..., shapeN, loc, scale)的元組的輸出。對於沒有形狀參數的正態分佈,它將僅返回(loc, scale)。對於一個伽馬分佈,它將返回(shape, loc, scale)。多個形狀參數的順序與您在分配中使用其他方法的順序相同。 This holds for all distributions.

+2

你也應該注意,如果您需要正確地滿足您的功能(沒有多餘的參數LOC的指數)你應該給一個參數絮狀物(固定位置)等於0(位置值你想修復)。 – EnricoGiampieri

+0

確實如此!謝謝你提到這一點。 –