根據博客文章「https://petewarden.com/2016/05/03/how-to-quantize-neural-networks-with-tensorflow/」,他們進入一個層之前Tensorflow量化值。經過圖層處理後,值被去量化。 Tensorflow由0到255之間重新縮放值量化值,因此它需要保持「最小」和「最大」去量化的值。如何Tensorflow做量化和反量化?
我想問: 1.如何在「量化」 OP的輸出的「最小」和「最大」的決定?我的意思是,如果我們只是找到了最小值和最大值,並將其設置爲0和255,做卷積時,我們將得到的數據溢出或下溢。 2.如何在一個「卷積」運算的輸出的「min」和「最大」被確定?量和激活都是量化的,所以有兩組「最小」和「最大」。卷積運算如何將它們組合成一組「最小」和「最大」?