2016-08-21 60 views
0

如果有一個基位圖小號和一組可能的位圖sucessor S1 ,...,SN ,如何可以訓練TensorFlow圖表來計算在這些sucessors的概率分佈?分佈在可變大小的輸入

每個位圖sK可以被同一個網絡處理爲一個單一的輸入,以給出表示它的可能性的實際值,然後可以通過softmax層映射到該值以給出概率分佈。

但是,手動執行此操作不允許使用反向傳播和實現的優化器,甚至不保證它會接受可變長度的輸入和輸出。

這甚至可能嗎?輸入和輸出張量似乎必須在批次維度上具有固定大小的appart。

回答

0

如果我理解正確的話,你有一個基地位小號並考慮到要序列S1的經銷模式,S2,...,SN

這可以使用序列標籤RNN模型,要序列S1的概率分佈模型,S2,...,SN來實現。但要在s上調節,可以將s的特徵向量連接到序列中的每個輸入。因此,在時間步長,輸入矢量到RNN將特徵矢量的級聯爲S_T小號和SOFTMAX後,預期的輸出應爲S_T + 1(即,損失應是這樣的,例如可以使用交叉熵損失)。

可變長度序列可以很好地使用。 Tensorflow總是儘可能多的佔位符的維度爲,即在運行圖形期間具有可變大小。因此,隨着變量批量大小,您可以擁有可變長度的序列。

+0

好吧,爲了更好地解釋它,我有一個位圖s和s1,...,sN是一個期望輸出的可變長度序列(其中N對於每個輸入都是可變的)。訓練和測試集包含這些輸入以及一個正確的輸出s *,這是預期的輸出之一。 – servabat

+0

此外,我想使用卷積圖層,因爲輸入基本上是圖像。 – servabat

+0

我認爲在每個位圖上應用相同的convnet,然後在連接的輸出上應用softmax會得到相關的結果,但我不確定它會允許使用tensorflow的優化器。 RNN會在這裏相關嗎?它可以與conv層一起使用嗎? – servabat