2016-02-04 59 views
11

在該R,我們有一個很好的預測模型,如:替代在Python中的r指數平滑狀態空間模型/ scikit/numpy的

ets(y, model="ZZZ", damped=NULL, alpha=NULL, beta=NULL, gamma=NULL, 

phi=NULL, additive.only=FALSE, lambda=NULL, 

lower=c(rep(0.0001,3), 0.8), upper=c(rep(0.9999,3),0.98), 

opt.crit=c("lik","amse","mse","sigma","mae"), nmse=3, 

bounds=c("both","usual","admissible"), ic=c("aicc","aic","bic"), 

restrict=TRUE, allow.multiplicative.trend=FALSE, use.initial.values=FALSE, ...) 

在這種方法中,如果我們指定的任何變量,它會自動獲取季節型,趨勢&錯誤類型model="ZZZ"/"AMA"/"MMZ"和一些因素自動調整,以獲得準確的結果。

  • 在Python中我們有兩種 大熊貓/ numpy的/ SciPy的/ scikit類似ets什麼?

    通過我的研究:
    Ewma在大熊貓是相似的,但我們需要硬編碼的所有參數固定的。
    在Holtwinter中,我們需要爲所有趨勢和季節類型編寫詳細的方法。

  • 因此,我們有沒有任何現成的功能,它需要 數據幀作爲輸入,並提供預測值,而不寫 任何內部函數的參數我們自己?

  • 任何微調回歸模型scikit/statsmodels?

+0

以下是關於R包採用的方法的一些參考資料:https://www.otexts.org/fpp/7/7 http://robjhyndman.com/talks/ABS1.pdf。到目前爲止,我還沒有找到一個實現完整狀態空間框架的python包。 – Zach

+0

你可以通過'rpy2'包使用Python的R工具嗎? –

+0

@mfripp是的,我可以從Python中調用R,但是我更願意直接使用python,如果可以的話! – Zach

回答

5

了一下週圍搜索後,我沒有發現任何東西,這似乎爲ets替代的蟒蛇真的有希望。儘管有一些嘗試:StatsModelspycast's Forecasting methods,您可以檢查它們是否符合您的需求。

您可以用來解決缺少的實現的一個選項是使用subprocess模塊從python運行R腳本。有關於如何做到這一點的非常好的文章here

爲了做到後來的:(前my_forecast.R

  1. 您需要創建的R腳本,該腳本將 計算(使用ets)和打印的天氣預報上文件或stdout(使用cat()命令),以便在腳本 運行後使用它們。
  2. 可以按以下運行從一個Python腳本將R腳本:

    import subprocess 
    
    # You need to define the command that will run the Rscript from the subprocess 
    command = 'Rscript' 
    path2script = 'path/to/my_forecast.R' 
    cmd = [command, path2script] 
    
    # Option 1: If your script prints to a file 
    subprocess.run(cmd) 
    f = open('path/to/created/file', 'r') 
    (...Do stuff from here...) 
    
    # Option 2: If your script prints to stdout 
    forecasts = subprocess.check_output(cmd, universal_newlines=True) 
    (...Do stuff from here...) 
    

    您也可以爭論添加到您的cmd,這將是您的RSCRIPT被用來作爲命令行參數,如下所示:

    args = [arg0, arg1, ...] 
    
    cmd = [command, path2script] + args 
    Then pass cmd to the subprocess 
    

編輯:

我在Holt-Winters Forecasting上發現了一系列文章:part1part2part3。除了容易在這些文章理解分析,格雷戈裏Trubetskoy(作者)提供了他開發的代碼:

初始趨勢:

def initial_trend(series, slen): 
    sum = 0.0 
    for i in range(slen): 
     sum += float(series[i+slen] - series[i])/slen 
    return sum/slen 

# >>> initial_trend(series, 12) 
# -0.7847222222222222 

初始季節性成分:

def initial_seasonal_components(series, slen): 
    seasonals = {} 
    season_averages = [] 
    n_seasons = int(len(series)/slen) 
    # compute season averages 
    for j in range(n_seasons): 
     season_averages.append(sum(series[slen*j:slen*j+slen])/float(slen)) 
    # compute initial values 
    for i in range(slen): 
     sum_of_vals_over_avg = 0.0 
     for j in range(n_seasons): 
      sum_of_vals_over_avg += series[slen*j+i]-season_averages[j] 
     seasonals[i] = sum_of_vals_over_avg/n_seasons 
    return seasonals 

# >>> initial_seasonal_components(series, 12) 
# {0: -7.4305555555555545, 1: -15.097222222222221, 2: -7.263888888888888, 
# 3: -5.097222222222222, 4: 3.402777777777778, 5: 8.069444444444445, 
# 6: 16.569444444444446, 7: 9.736111111111112, 8: -0.7638888888888887, 
# 9: 1.902777777777778, 10: -3.263888888888889, 11: -0.7638888888888887} 

最後算法:

def triple_exponential_smoothing(series, slen, alpha, beta, gamma, n_preds): 
    result = [] 
    seasonals = initial_seasonal_components(series, slen) 
    for i in range(len(series)+n_preds): 
     if i == 0: # initial values 
      smooth = series[0] 
      trend = initial_trend(series, slen) 
      result.append(series[0]) 
      continue 
     if i >= len(series): # we are forecasting 
      m = i - len(series) + 1 
      result.append((smooth + m*trend) + seasonals[i%slen]) 
     else: 
      val = series[i] 
      last_smooth, smooth = smooth, alpha*(val-seasonals[i%slen]) + (1-alpha)*(smooth+trend) 
      trend = beta * (smooth-last_smooth) + (1-beta)*trend 
      seasonals[i%slen] = gamma*(val-smooth) + (1-gamma)*seasonals[i%slen] 
      result.append(smooth+trend+seasonals[i%slen]) 
    return result 

# # forecast 24 points (i.e. two seasons) 
# >>> triple_exponential_smoothing(series, 12, 0.716, 0.029, 0.993, 24) 
# [30, 20.34449316666667, 28.410051892109554, 30.438122252647577, 39.466817731253066, ... 

你可以把那些文件,例如:holtwinters.py一個文件夾內結構如下:

forecast_folder 
| 
└── __init__.py 
| 
└── holtwinters.py 

從這裏開始,這是一個Python模塊,你可以在每個項目結構內放置你想要在項目中的任何地方使用它,只需導入它。

+0

我真的很想避免調用R子流程。我很欣賞詳細的答案,但我設置了賞金,因爲我希望能夠在Python中找到某些東西。 – Zach

+0

目前在我的回答開始時已經有了一些嘗試,而@jseabold是StatsModels的初始開發人員,所以如果您查詢他,他可能會對此有所瞭解! –

+0

我已經添加了一個現成的方式來做霍爾特溫特斯預測python –