0
我想要「卷積」層,其中所述過濾器大小爲1,我可以使用實現這個(選項1)更高效1D卷積當過濾器大小爲1
tflearn.layers.conv.conv_1d(input, n_output_channels, 1)
或自己使用輥(選項2)
tf.matmult(input, tf.tile(weights, [batch_size, 1, 1]))
其中輸入具有的尺寸[批次,序列,n_input_channels]和權重爲[1,n_input_channels,n_output_channels]。
這兩個選項的性能似乎大致相當,但我猜測兩者的效率都很低:選項1大概是從預期「真實」卷積開始的開銷,而選項2中的tile操作看起來應該是不必要的。有更聰明的方法可以做到這一點?
是的,我主要關心GPU上的性能。謝謝。 – daknowles