如何在深度學習平臺上將各種尺寸的圖像作爲RNN或CNN的輸入文件？

我想使用圖像文件（約10,000張圖像，大小各異）作爲輸入文件，以使圖像識別程序可能使用CNN（或RNN）。如何在深度學習平臺上將各種尺寸的圖像作爲RNN或CNN的輸入文件？

我不介意使用任何像Tensorflow，Caffe，Spark + Tensorflow等深度學習平臺。看起來他們都使用像256 * 256這樣的固定大小，但會有什麼方法可以使用圖像文件與所有不同的大小？

如果不是，那麼當前支持最大圖像像素大小的平臺將作爲其輸入文件是什麼？

2017-02-24 Judy Kim

最好的想法是將您的圖像縮放到所需的格式。神經網絡的想法是爲某種輸入格式提供一定的輸出。但是，您可以將該輸入的大小更改爲1000x1000，但這顯然會導致較慢的學習過程。

256x256維度可能是對此事進行廣泛研究並給出最佳結果的結果。

2017-02-24 07:46:45 PinkFluffyUnicorn

回答