我嘗試製作與CIFAR10類似的數據集。我發現這個教程: How to create dataset similar to cifar-10如何使用幾張圖像製作與CIFAR10相似的數據集
我已經可以做一個數據集1倍的圖像,但是當我嘗試使用一些圖片,我得到這個錯誤:
tensorflow.python.framework.errors.InvalidArgumentError: Indices are not valid: not lexicographically sorted or containing repeats.
誰能幫我解決這個問題呢?
這是我的代碼:
from PIL import Image
import numpy as np
out =np.empty([20,7501])
for j in xrange(0, 10):
im = Image.open('%d_receipt.jpg' % j)
im = (np.array(im))
r = im[:,:,0].flatten()
g = im[:,:,1].flatten()
b = im[:,:,2].flatten()
label = [0]
out[j] = np.array(list(label) + list(r) + list(g) + list(b),np.uint8)
for i in xrange(0, 10):
im = Image.open('%d_news.jpg' % i)
im = (np.array(im))
r = im[:,:,0].flatten()
g = im[:,:,1].flatten()
b = im[:,:,2].flatten()
label = [1]
j = i + 10
out[j] = np.array(list(label) + list(r) + list(g) + list(b),np.uint8)
out.tofile("data_batch.bin")
我可能聽起來很愚蠢,但你能告訴你如何獲得「train_32x32.mat」文件嗎?這些是我們想要訓練的數據集的提取特徵嗎? – shivisuper