2017-02-24 65 views
1

我想使用圖像文件(約10,000張圖像,大小各異)作爲輸入文件,以使圖像識別程序可能使用CNN(或RNN)。如何在深度學習平臺上將各種尺寸的圖像作爲RNN或CNN的輸入文件?

我不介意使用任何像Tensorflow,Caffe,Spark + Tensorflow等深度學習平臺。 看起來他們都使用像256 * 256這樣的固定大小,但會有什麼方法可以使用圖像文件與所有不同的大小?

如果不是,那麼當前支持最大圖像像素大小的平臺將作爲其輸入文件是什麼?

回答

0

最好的想法是將您的圖像縮放到所需的格式。神經網絡的想法是爲某種輸入格式提供一定的輸出。但是,您可以將該輸入的大小更改爲1000x1000,但這顯然會導致較慢的學習過程。

256x256維度可能是對此事進行廣泛研究並給出最佳結果的結果。