我打算實施一個CNN,該CNN可以使用NYU深度v2數據集來估算單幅圖像的深度。通過教程已經向我表明,實施一個處理Caffe分類問題的CNN是很容易的。我很好奇,如果Caffe適合於涉及多維地面真理(例如深度圖像)和迴歸(深度估計)的任務。Caffe上的多維標籤數據
我想要實現的是使用深度圖像作爲基礎事實來訓練可以估計深度圖像的CNN。我需要將標籤加載爲單通道圖像數據。
我只能找到Shelhamer這個答案是有關我的問題https://groups.google.com/d/msg/caffe-users/JXmZrz4cCMU/mBTU1__ohg4J
我知道我應該定義了兩個頂層,一個用於輸入,另一個用於深度數據的地面實況。然後我可以使用損失層(如EucledianLoss)來計算損失。我在下面添加了一個模型。
該模型是否按預期工作?如果不是,還有其他方法可以在Caffe上做到嗎?
layer {
name: "data"
type: "ImageData"
top: "data"
image_data_param {
source: "input_set.txt"
batch_size: 50
}
}
layer {
name: "label"
type: "ImageData"
top: "label"
image_data_param {
source: "depth_set.txt"
batch_size: 50
}
is_color: false
}
layer {
name: "loss"
type: "EuclideanLoss"
bottom: "some_output_layer_name"
bottom: "label"
top: "loss"
}
您是否完成了結果?我一直在嘗試同樣的事情。但我無法想出一個解決我的問題的網絡。 – thigi