tensorflow

    0熱度

    1回答

    我們已經培訓了一個tf-seq2seq模型來回答問題。主要框架是google/seq2seq。我們使用雙向RNN(GRU編碼器/解碼器128單元),增加了軟關注機制。 我們將最大長度限制爲100個字。它大多隻產生10〜20個單詞。 對於模型的推斷,我們嘗試兩種情況: 正常(貪心算法)。其推斷時間約爲40ms〜100ms 光束搜索。我們嘗試使用波束寬度5,其推斷時間約爲400ms〜1000ms。 所

    2熱度

    2回答

    我經常看到大寫和小寫單個字符變量。我不確定是否選擇了案例,因爲變量是一個類的實例,float32,或者只是個人偏好。 以下是Tensorflow入門指南的示例。 https://www.tensorflow.org/get_started/get_started W = tf.Variable([.3], dtype=tf.float32) b = tf.Variable([-.3], dtyp

    1熱度

    1回答

    self.logits = nn_layers.full_connect_(self.wide_deep_embed, config.num_classes, activation='None', use_bn = True, \ keep_prob=self.keep_prob, name='output_layer') # predict prob ## loss

    0熱度

    1回答

    我試圖端口this模型爲Keras V2,但我有以下功能相關的問題: def __call__(self, sent1, sent2): def _outer(AB): att_ji = K.batch_dot(AB[1], K.permute_dimensions(AB[0], (0, 2, 1))) return K.permute_dimensions

    0熱度

    1回答

    我建立了一個使用conv3d的張量流模型,凍結它併爲推理進行了優化。當我把在Android上的推理(TensorflowInferenceInterface.run),我收到以下錯誤: java.lang.IllegalArgumentException: No OpKernel was registered to support Op 'Conv3D' with these attrs. Re

    1熱度

    1回答

    我已經實現了CNN數字分類模型。我的模型過度配合,爲了克服過度配合,我試圖在我的成本函數中使用L2 Regularization。我有一個小混亂 我怎麼能選擇<weights>把成本公式(代碼的最後一行)。 ... x = tf.placeholder(tf.float32, shape=[None, img_size, img_size, num_channels], name='x') #

    0熱度

    1回答

    我是一個機器學習的新手,這是第一個真正的ML任務挑戰之一。 一些實驗數據包含512個獨立的布爾特徵和一個布爾結果。 在提供的數據集中有大約1e6個實驗實驗記錄。 在經典的XOR示例中,需要4種可能狀態中的4種來訓練NN。在我的情況下,它只有2^(10-512) = 2^-505接近零。 我沒有關於數據性質的更多信息,只是這些(512 + 1) * 1e6位。 在可用數據上嘗試了帶有1個隱藏層的NN

    0熱度

    1回答

    我有一個多層感知器,每個感知器有5個隱藏層和256個神經元。當我開始訓練時,每次訓練樣本都會得到不同的預測概率,直到時期50,但隨後重複預測的次數增加,在時期300,我已經有30%的重複預測,這是沒有意義的,因爲輸入數據是不同的所有訓練樣本。任何想法是什麼導致這種行爲? 澄清: 與「重複預測」,我指的是完全相同的預測概率項目屬於A類(這是一個二元分類問題) 我有200 4000個訓練樣本每個和所有

    3熱度

    1回答

    我想在一定數量的紀元後從Adam切換到SGD。我該如何順利完成這項工作,以便將權重/梯度傳遞給新優化器?

    0熱度

    1回答

    當我學習TensorFlow通過嘗試的例子mnist_softmax.py(this is the orignal file),我爲了一些修改添加到它使用TensorBoard: tf.global_variables_initializer().run() merged_summary_op = tf.summary.merge_all() summary_writer =