1
我想在Keras的詞級上訓練語言模型。Keras LSTM/GRU語言模型的輸入形狀
我有我的X和Y,都與形狀(90582L,517L)
當我試圖適應這種模式:
print('Build model...')
model = Sequential()
model.add(GRU(512, return_sequences=True, input_shape=(90582, 517)))
model.add(Dropout(0.2))
model.add(GRU(512, return_sequences=True))
model.add(Dropout(0.2))
model.add(TimeDistributedDense(1))
model.add(Activation('softmax'))
model.compile(loss='categorical_crossentropy', optimizer='rmsprop')
model.fit(x_pad, y_pad, batch_size=128, nb_epoch=2)
我得到的錯誤:
Exception: Error when checking model input:
expected gru_input_7 to have 3 dimensions, but got array with shape (90582L, 517L)
我需要一些關於輸入形狀應該是什麼的指導?我對各種組合進行了嘗試和錯誤,但似乎我誤解了一些根本性的東西。
在Keras文本生成示例中,X矩陣有3個維度。我不知道第三維應該是什麼。