我試圖使用Hyndman and Athanasopoulos's Forecasting Principles and Practice進行預測,當嘗試使用我自己的數據進行預測時(使用forecast
軟件包),我遇到了一些令人討厭的問題。使用預測軟件包進行R預測
我的問題是:由meanf
產生
預測具有索引1,而不是樣品的端部,因此繪製變得有點混亂(因此在x,y的東西,在下面的代碼)。這似乎並沒有發生用於h &一個在他們的教科書......使用
snaive
和zoo
產生預測時,我居然有日期的日期(而不是數字)似乎打了一些問題,因爲一旦通過預測(bikefit3),數據有6個NA,然後是每週1次,而不是每週的每一天。
大多數未成年人 - 因爲我在這裏預測樣本不足,當我點擊總結時,我會得到特定「訓練樣本」的預測誤差。有什麼方法可以確定這個時期是什麼?我試圖找出手動,但數字看起來很奇怪。
我的R代碼裏面(這應該是可再現的,因爲我從Dropbox的加載數據)是:
no_f <- 21
bike <-repmis::source_DropboxData("bike_hires.csv","8s4bpjft6zrt4jz",sep = ",",header = TRUE)
bike$date <- as.Date(bike$Day,format="%d/%m/%Y")
dat.xts <- xts(bike$Number.of.Bicycle.Hires,order.by=bike$date)
bike.z <- zoo(dat.xts,order.by=index(dat.xts),frequency=7)
bikefit1 <- meanf(bike.z,h=no_f)
bikefit2 <- naive(bike.z, h=no_f)
bikefit3 <- snaive(bike.z, h=no_f)
x <- bikefit1$mean
y <- seq(1251/7,(1251+no_f-1)/7,1/7)
plot(bike.z[1100:1251],xlim=range(1100/7,(1251+no_f-1)/7),ylim=range(bike.z[1100:1251]),type="l",col=1,main="Forecasts for daily bike hires",xlab="",ylab="")
par(new=T)
plot(y,x,xlim=range(1100/7,(1251+no_f-1)/7),ylim=range(bike.z[1100:1251]),type="l",col=4,xaxt="n",yaxt="n",xlab="",ylab="")
lines(bikefit2$mean,col=2)
lines(bikefit3$mean,col=3)
mtext("Day",side=1,line=3,font=2)
mtext("Number of Bike Hires",side=2,line=3,font=2)
legend("topright",lty=1,col=c(4,2,3), legend=c("Mean method","Naive method","Seasonal naive method"))
預先感謝任何幫助你能提供給我!