2016-12-05 75 views
0

我正在使用ConvNet解決檢測問題。但在我的情況下,標籤是每個圖像的尺寸爲[3 x 5]的矩陣。我使用Caffe進行這項工作。我使用Datalayer閱讀圖片,同時使用HDF5Layer閱讀標籤。Caffe多標籤矩陣輸入

HDF5Layer將[3x5]標籤矩陣讀取爲[1x15]維向量。 因此,我使用Reshape Layer在計算L2損失之前將矢量重塑爲矩陣。但是我意識到整形層格式化了H x W中的數據,而我的標籤矩陣是[W x H],即[w = 3,h = 5] ,因此重塑是不正確的。不知是否有辦法重塑在正確的順序即[1x15]標籤矢量,[3x5][5x3]

的另一種方式,我想我可以解決由輸出形式卷積層變平成爲[1×15]和然後使用我的[1 x 15]標籤計算損失。

由於我的英語水平差,我正在使用數字顯示問題以便更好地理解。我輸入矩陣標籤

Eample(注意,圖像只是誇張地表示)來自Caffe重塑層

enter image description here

任何建議的 Input Matrix Lab

的結果,如果我這樣做對嗎?

回答

1

無論哪種計算損失的方式都很好。事實上,1x15形狀的計算將爲您節省轉換時間。損失計算仍然是逐像素的;邏輯組織並不重要。

使用相同的想法,計算3x5或5x3並不重要;所有重要的是你的卷積輸出和你的標籤相互匹配。

如果您希望顯示(圖形,圖片等)匹配,也許您可​​以在繪製輸出之前切換x和y指定。

+0

感謝@Prune實際上,我確實注意到了您在調試時提到的內容。 –