我正在使用ConvNet解決檢測問題。但在我的情況下,標籤是每個圖像的尺寸爲[3 x 5]
的矩陣。我使用Caffe進行這項工作。我使用Datalayer
閱讀圖片,同時使用HDF5Layer
閱讀標籤。Caffe多標籤矩陣輸入
HDF5Layer將[3x5]
標籤矩陣讀取爲[1x15]
維向量。 因此,我使用Reshape Layer
在計算L2損失之前將矢量重塑爲矩陣。但是我意識到整形層格式化了H x W
中的數據,而我的標籤矩陣是[W x H]
,即[w = 3,h = 5] ,因此重塑是不正確的。不知是否有辦法重塑在正確的順序即[1x15]
標籤矢量,[3x5]
和不[5x3]
的另一種方式,我想我可以解決由輸出形式卷積層變平成爲[1×15]和然後使用我的[1 x 15]標籤計算損失。
由於我的英語水平差,我正在使用數字顯示問題以便更好地理解。我輸入矩陣標籤
Eample(注意,圖像只是誇張地表示)來自Caffe重塑層
的結果,如果我這樣做對嗎?
感謝@Prune實際上,我確實注意到了您在調試時提到的內容。 –