2017-07-06 35 views
-1

如何格式化數據集以在Python中進行培訓?如何格式化數據集以進行Python培訓?

我有一些手寫數字的3000灰度BMP圖像(就像MNIST)。現在我想用這個數據集來訓練我的模型(我正在使用Keras庫),並且我正在使用卷積神經網絡進行訓練。

我使用此代碼圖像中的一個轉換成陣列

`import numpy 
from PIL import Image 
import matplotlib.pyplot as plt 
import matplotlib.image as mpimg 
import numpy as np 
img = Image.open(open('CMATERdb 3.3.1\Ad02599.bmp')).convert("L") 
print(img.format, img.size, img.mode) 
img = numpy.asarray(img)/255. 
imgplot = plt.imshow(img)` 

和從代碼的結果是

無(32,32)L-

image from the 3000 image want to convert into dataset

任何幫助我如何轉換所有圖像,並把它們放在相同的MNIST數據格式將是h高度讚賞。

+0

嗨,阿里,歡迎來到SO。這太不確定和廣泛。請看看這個改進你的問題:https://stackoverflow.com/help/how-to-ask – petezurich

回答

1

您可以使用任何將圖像文件加載到陣列的庫,例如Pillow

閱讀Pillow的文檔,瞭解如何將圖像文件加載到數組中。然後,通常應該將數組縮放到0到1之間的值。通常,您只需將圖像數組除以255(因爲它們是0到255之間的RGB值)。確保最終形成這樣的陣列:(3000,寬度,高度,通道),其中通道通常是3(紅色,綠色,藍色)。

相關問題