2017-04-10 82 views
1

我是深度學習的新手,我在Keras上苦於某些數據格式。我的CNN基於A.Newell等人的Stacked Hourglass Networks for Human Pose Estimation如何格式化Keras上的訓練輸入和輸出數據

在此網絡上,輸入爲256x256 RGB圖像,輸出應爲突出身體關節(肩,膝,...)的64x64熱圖。我設法建立了網絡,並將所有數據(圖像)與他們的註釋(身體關節的像素標籤)一起使用。我想知道如何格式化訓練集的輸入和輸出數據來訓練我的模型。目前我使用numpy數組(256,256,3)作爲圖像,我不知道如何格式化我的輸出。我應該創建一個表[n,64,64,7]嗎? (n是訓練集的大小,7是我用來獲得7個關節的熱圖的濾波器的數量)

謝謝你的時間。

回答

0

輸出也可以是一個numpy數組。 考慮這個例子: 訓練集:50張圖像,大小爲256x256x3。這可以組合成一個形狀單一的numpy數組(50,256,256,3)。 格式化輸出數據的類似方法。下面 示例代碼:

#a, b and c are arrays of size 256x256x3 
    import numpy as np 

    temp = [] 
    temp.append(a) 
    temp.append(b) 
    temp.append(c) 
    output_labels = [] 
    output_labels = np.stack(temp) 

的output_labels陣列將形狀(3x256x256x3)的。