2016-11-07 28 views
2

我有一個csv文件中的降雨值時間序列。我繪製了數據的直方圖。直方圖偏向左側。我想改變這些值,以便它具有正常的分佈。我使用了R中的Yeo-Johnson變換。變換的值是here爲Yeo和Johnson變換估算Lambda

我的問題是:

在上述變換中,我使用的0.5的λ的測試值,這工作正常。是否有根據時間序列確定lambda的最優值?我會感謝任何建議。

到目前爲止,下面的代碼:

library(car) 
dat <- scan("Zamboanga.csv") 
hist(dat) 
trans <- yjPower(dat,0.5,jacobian.adjusted=TRUE) 
hist(trans) 

Here is the csv file

回答

2

首先使用汽車包裝中的函數boxCox通過最大似然估計λ來找到最優lambda。

您可以繪製這樣說:

boxCox(your_model, family="yjPower", plotit = TRUE) 

example from CV

正如本Bolker在評論說,這裏的模型可以像

your_model <- lm(dat~1) 

然後使用優化的拉姆達在你現有的代碼中。

+1

我對什麼模型(Box-Cox命令中的對象)適用於我的數據感到困惑。截至目前,我不適合任何數據模型。 – Lyndz

+2

最明顯的將是擬合一個微不足道的線性模型:'your_model < - lm(dat〜1)'。 –

+0

@Lyndz是的,我會採取本博爾克的建議 –