1
我正在研究生成敵對網絡。最近,在閱讀Radford等人的論文的同時, here,我發現他們的發電機網絡的輸出層使用Tanh()。 Tanh()的範圍是(-1,1),但是,雙精度格式的圖像的像素值位於[0,1]。有人可以解釋爲什麼Tanh()用於輸出層,以及發生器如何生成具有適當像素值的圖像?在發生器網絡的輸出層中使用Tanh()
我正在研究生成敵對網絡。最近,在閱讀Radford等人的論文的同時, here,我發現他們的發電機網絡的輸出層使用Tanh()。 Tanh()的範圍是(-1,1),但是,雙精度格式的圖像的像素值位於[0,1]。有人可以解釋爲什麼Tanh()用於輸出層,以及發生器如何生成具有適當像素值的圖像?在發生器網絡的輸出層中使用Tanh()
如果您查看紙張的代碼,您會看到作者預處理圖像:https://github.com/soumith/dcgan.torch/blob/master/data/donkey_folder.lua#L68,以便在[-1, 1]
中獲取圖像的值。
然後,在生成部分,他們將圖像重新縮放爲[0, 1]
:https://github.com/soumith/dcgan.torch/blob/master/generate.lua#L89中的值。