Caffe多標籤矩陣輸入

我正在使用ConvNet解決檢測問題。但在我的情況下，標籤是每個圖像的尺寸爲[3 x 5]的矩陣。我使用Caffe進行這項工作。我使用Datalayer閱讀圖片，同時使用HDF5Layer閱讀標籤。Caffe多標籤矩陣輸入

HDF5Layer將[3x5]標籤矩陣讀取爲[1x15]維向量。因此，我使用Reshape Layer在計算L2損失之前將矢量重塑爲矩陣。但是我意識到整形層格式化了H x W中的數據，而我的標籤矩陣是[W x H]，即[w = 3，h = 5] ，因此重塑是不正確的。不知是否有辦法重塑在正確的順序即[1x15]標籤矢量，[3x5]和不[5x3]

的另一種方式，我想我可以解決由輸出形式卷積層變平成爲[1×15]和然後使用我的[1 x 15]標籤計算損失。

由於我的英語水平差，我正在使用數字顯示問題以便更好地理解。我輸入矩陣標籤

Eample（注意，圖像只是誇張地表示）來自Caffe重塑層

任何建議的

的結果，如果我這樣做對嗎？

來源

2016-12-05 kcc__

無論哪種計算損失的方式都很好。事實上，1x15形狀的計算將爲您節省轉換時間。損失計算仍然是逐像素的;邏輯組織並不重要。

使用相同的想法，計算3x5或5x3並不重要;所有重要的是你的卷積輸出和你的標籤相互匹配。

如果您希望顯示（圖形，圖片等）匹配，也許您可以在繪製輸出之前切換x和y指定。

來源

2016-12-05 21:59:53 Prune

感謝@Prune實際上，我確實注意到了您在調試時提到的內容。 –

Caffe多標籤矩陣輸入

回答

相關問題