你可以用一個單一的輸入節點和做時間序列預測這樣的單一輸出節點訓練的LSTM網絡:
首先,就像一個很好的做法,讓我們使用Python3的打印功能:
from __future__ import print_function
然後,作一個簡單的時間序列:
data = [1] * 3 + [2] * 3
data *= 3
print(data)
[1,1,1,2,2,2,1,1,1,2,2,2,1,1,1, 2,2,2]
立即把這個時間序列到一個監督數據集,其中每個樣本的目標是下一樣本:
from pybrain.datasets import SequentialDataSet
from itertools import cycle
ds = SequentialDataSet(1, 1)
for sample, next_sample in zip(data, cycle(data[1:])):
ds.addSample(sample, next_sample)
構建簡單LSTM網絡與1個輸入節點,5個LSTM細胞和1個輸出節點:
from pybrain.tools.shortcuts import buildNetwork
from pybrain.structure.modules import LSTMLayer
net = buildNetwork(1, 5, 1,
hiddenclass=LSTMLayer, outputbias=False, recurrent=True)
訓練網絡:
from pybrain.supervised import RPropMinusTrainer
from sys import stdout
trainer = RPropMinusTrainer(net, dataset=ds)
train_errors = [] # save errors for plotting later
EPOCHS_PER_CYCLE = 5
CYCLES = 100
EPOCHS = EPOCHS_PER_CYCLE * CYCLES
for i in xrange(CYCLES):
trainer.trainEpochs(EPOCHS_PER_CYCLE)
train_errors.append(trainer.testOnData())
epoch = (i+1) * EPOCHS_PER_CYCLE
print("\r epoch {}/{}".format(epoch, EPOCHS), end="")
stdout.flush()
print()
print("final error =", train_errors[-1])
繪製錯誤(注意,在這個簡單的玩具例如,我們正在測試和對同一數據集,這當然不是你一個真正的項目做培訓):
import matplotlib.pyplot as plt
plt.plot(range(0, EPOCHS, EPOCHS_PER_CYCLE), train_errors)
plt.xlabel('epoch')
plt.ylabel('error')
plt.show()
現在問的網絡來預測下一個樣本:
for sample, target in ds.getSequenceIterator(0):
print(" sample = %4.1f" % sample)
print("predicted next sample = %4.1f" % net.activate(sample))
print(" actual next sample = %4.1f" % target)
print()
(上面的代碼是基於example_rnn.py
並從PyBrain documentation實施例)
我可否要求在訓練步驟中的一些說明。訓練階段的CYCLES和EPOCHS_PER_CYCLE部分究竟做了什麼?它與僅僅訓練多少個時代有何不同呢? – 2015-10-27 10:00:37
@ A.Devereux它正在保存錯誤。我認爲作者希望保存每個EPOCHS_PER_CYCLE中的錯誤,在這種情況下,它比所有錯誤小5倍。 – MCSH 2016-01-08 13:14:20