2017-07-21 152 views
0

我正在做一個機器學習項目來識別手寫數字。實際上,我只是想向MNIST添加更多的數據集,但我無法這樣做。將數據添加到MNIST數據集

我做了以下內容:

n_samples = len(mnist.data) 
x = mnist.data.reshape((n_samples, -1))# array of feature of 64 pixel 
y = mnist.target       # Class label from 0-9 as there are digits 

img_temp_train=cv2.imread('C:/Users/amuly/Desktop/Soap/crop/2.jpg',0) 

X_train, X_test, y_train, y_test = train_test_split(x, y, test_size=0.2) 

#Now I want to add the img_temp_train to my dataset for training. 

X_train=np.append(X_train,img_temp_train.reshape(-1)) 
y_train=np.append(y_train,[4.0]) 

訓練後的長度爲:

  • 43904784(X_train)
  • 56001(y_train)

但它應該是56001對彼此而言。

回答

0

試試這個:

X_train = np.append(X_train, [img_temp_train], axis=0) 

你不應該不管三七二十一,而不考慮你在做什麼第一整型的東西!

而且,它通常是一個好主意,用連擊:

X_train = np.concatenate((X_train, [img_temp_train]), axis=0) 
+0

不工作,因爲X_train.shape是(56000,784),而img_temp_train.shape是(784) – Amul123

+0

更新。 (在第一個例子中忘了包含'axis = 0')。 –