2016-06-14 126 views
-2

基於給定數據的下一個值,我代表侵犯每個year.How預測,在未來幾年中的違規R.預測中的R

矢量
year <- c(190519, 223721, 235321, 101934) 

請幫我

+2

你不能。沒有足夠的信息來建立模型,更不用說預測模型。 – akash87

+0

如果您要實現任何預測,則需要更多的數據點和一些預測變量/解釋變量 –

+0

您還可以對數據施加模型,例如, [AR(p)](https://en.wikipedia.org/wiki/Autoregressive_model),[MA(q)](https://en.wikipedia.org/wiki/Moving-average_model)或甚至收集[ARIMA(p,d,q)](https://en.wikipedia.org/wiki/Autoregressive_integrated_moving_average)模型。或者,更復雜的[狀態空間模型](https://en.wikipedia.org/wiki/State-space_representation)。然而,這些模型需要更多的數據和其他假設。 – Therkel

回答

2

爲了說明akash87和Dominic Comtols,這將是徒勞的很少的信息來預測所提出的意見,這裏有一個線性模型的方法和可視化ggplot:

year<-c(190519 ,223721, 235321, 101934) 
df <- data.frame(year=1:4, crime= year) 
library(ggplot2) 

ggplot(df, aes(x=year, y=crime)) + 
     geom_point() + 
     geom_smooth(method="lm", fullrange=T) + 
     xlim(1,6) 

enter image description here

由於從看到通過外推6年線性模型的預測值可以在灰色區域內進行,即在-339737和537576之間。你最好只是猜測......

+0

您能否介紹一下這是如何工作的@Adam Quek –

+0

這是一個簡單的線性迴歸模型,其中第一年有190519次違規,第二年有223721次違規,第三年有235321次違規,第四年有101934次違規(以點)。迴歸線對稀疏數據提供最佳擬合,而灰色區域表示迴歸模型的95%置信區間。 –

+1

請不要使用迴歸推斷和預測。我這樣做只是爲了說明甚至嘗試用4個數據點進行預測是多麼荒謬。 –

1

數據集是一個可靠的預測太小了,但你可以嘗試以下方法,只是爲了說明上時間序列預測怎麼能原則上獲得的可能性:

year <- c(190519, 223721, 235321, 101934) 
library(forecast) 
yearforecasts <- HoltWinters(as.ts(year), beta=FALSE, gamma=FALSE) 
yearforecasts2 <- forecast.HoltWinters(yearforecasts,h=1) 
> yearforecasts2 
# Point Forecast Lo 80 Hi 80 Lo 95 Hi 95 
#5  190518.3 95821.09 285215.5 45691.42 335345.2 
plot.forecast(yearforecasts2) 

enter image description here

由於數據點的數量非常少,預測不準確,誤差較大。正如在這個答案的開頭和評論中所指出的,有用的預測需要更多的數據。出於同樣的原因,用這種方法預測超過一年是不可能的。