1

在TensorFlow示例中的Cifar10示例中,他們使用裁剪,翻轉,增亮,對比和美白的隨機組合來扭曲圖像。這個概念是有道理的,除了裁剪對我來說似乎有點奇怪。這些圖像將需要對網絡和裁剪代碼相同的尺寸看起來是這樣的:TensorFlow - Cifar10示例中的random_crop是什麼?

height = IMAGE_SIZE 
    width = IMAGE_SIZE 

    # Image processing for training the network. Note the many random 
    # distortions applied to the image. 

    # Randomly crop a [height, width] section of the image. 
    distorted_image = tf.random_crop(reshaped_image, [height, width, 3]) 

由於高度和寬度都是基於圖像尺寸爲這實際上做什麼?

回答

1

在此示例中,IMAGE_SIZE設置爲24。所以基本上這個代碼所做的是選擇一個隨機選擇的偏移量並提取一個24 X 24補丁。它可能確保偏移的選擇方式可以在沒有任何環繞或其他奇怪邊界條件的情況下提取補丁,或者可以填充它(應該很容易檢查)。

我猜IMAGE_SIZE可能會更好地命名爲PATCH_SIZE什麼的。請注意原始的CIFAR 10輸入圖像是32 x 32

+0

謝謝,這清除它! –

+0

@bradden_​​gross很高興能夠提供幫助! –

相關問題