theano

    3熱度

    1回答

    我試圖確定模型的準確性而無需進行培訓並更新權重,因此我已將所有圖層設置爲trainable = False。 當我在shuffle = False的發電機上運行fit_generator時,每次都會得到一致的結果。 當我在shuffle = True的發生器上運行fit_generator時,結果會跳轉一點。假設輸入數據相同,並且模型沒有訓練,我希望模型的內部狀態不會改變,並且不管排序如何,相同數

    2熱度

    1回答

    我已經使用Theano後端實現了具有Keras的卷積自動編碼器。我正在改變我的方法來嘗試處理不同大小的圖像。只要我使用numpy的stack函數來建立數據集(等大小的圖像),我是金。但是,對於不同大小的圖像,我們不能使用stack,而fit需要一個numpy數組。所以我改爲fit_generator以避免大小檢查。問題在於最後一層預期將16作爲輸入中的最後一個維度,我不明白爲什麼它會獲得原始圖像的

    0熱度

    1回答

    繼這個paper on domain adaptation之後,我試圖在Tensorflow中實現以下漸變反轉圖層(在Thera後端編寫Keras,在Keras issue中找到),因爲我的模型與Theano運行不佳。 class GradientReversalLayer(Layer): """ Reverse a gradient <feedforward> return

    0熱度

    1回答

    我正在使用Alexnet等預先訓練過的模型,在這種情況下也是以相同的錯誤結束。 我從這裏下載的alexnet_weights - >https://github.com/heuritech/convnets-keras 然後,我嘗試這樣 從keras.models導入load_model base_model = load_model( 'alexnet_weights.h5') 我結束了 Val

    1熱度

    1回答

    我不明白爲什麼在使用卷積神經網絡時需要翻轉過濾器。 據烤寬麪條文檔, flip_filters:布爾(默認:true) 是否滑動他們在輸入, 進行卷積(這是默認值)之前翻轉過濾器,或者不要將它們翻轉 並執行關聯。需要注意的是在意大利千層麪的一些其他卷積 層,翻轉招致的開銷,並通過 默認情況下禁用 - 利用 另一層瞭解到的權重時查看文檔。 這是什麼意思?在任何神經網絡書籍中進行卷積時,我從來沒有讀過

    2熱度

    3回答

    我想在Keras培訓GAN。我的最終目標是BEGAN,但我從最簡單的一個開始。瞭解如何正確凍結重量是必要的,這就是我所苦苦掙扎的。 在生成器訓練時間期間,鑑別器權重可能不會更新。我想凍結和解凍鑑別交替爲訓練發生器和鑑別器。問題是,設置可訓練的參數爲false,鑑別器模型或甚至在其'權重不停止模型來訓練(和權重更新)。另一方面,當我在將可訓練設置爲False之後編譯模型時,權重變爲unfreezab

    1熱度

    1回答

    到目前爲止,我想出了這個哈克代碼在這裏,該代碼運行並輸出 Epoch 10/10 1/3000 [..............................] - ETA: 27s - loss: 0.3075 - acc: 0.7270 6/3000 [..............................] - ETA: 54s - loss: 0.3075 -

    0熱度

    1回答

    起初,我用tensorflow後端運行keras,並且進度條很好。然後我安裝了Theano,並嘗試使用它一段時間之後,切換回tensorflow。在安裝Theano之後,每個時代出現的進度條只會在時代完成後出現,所以在訓練時,我看不到它的進展。 Epoch 1/50 21/21 [=============================] 10s - loss:0.6928 - loss_va

    2熱度

    1回答

    在theano中,獲得某個變量w.r.t的梯度非常容易。一個給定的損失: loss = f(x, w) dl_dw = tt.grad(loss, wrt=w) 我得到pytorch被冠上了不同的模式,在那裏你會做這樣的事情: loss = f(x, w) loss.backwards() dl_dw = w.grad 的事情是我可能不想通過做一個完整的向後傳播圖 - 只是沿着需要去

    0熱度

    1回答

    我想比較Theano和CNTK在一個非常簡單的任務上的性能:GPU上的矩陣向量產品。我正在使用Theano 0.9.0和CNTK 2.0。 我想測量設備上計算所用的時間,不包括從主機到設備的數據傳輸所用的時間,反之亦然。 我得到的結果是這樣的: figure (timings theano vs cntk) (N是重複次數d,矩陣的大小,被設定爲10000。) 問題1: 它似乎用於某些準備工作的時