2016-12-16 64 views
0

我試圖使用來自mnist示例的受過訓練的LeNet模型來對給定圖像中的數字進行分類。我在閱讀cpp classification example,因爲它讀取圖像(儘管是ImageNet數據)並對其進行分類。 我對Imagenet中的sysnet文件是什麼以及它如何用於分類感到困惑?我們是否也需要一個Lenet的標籤文件來對手寫數字進行分類,如果是這樣,如何創建一個以及格式應該如何?使用Caffe對圖像中的手寫數字進行分類

回答

1

caffe本身就有一個很好的關於這個主題的教程:http://caffe.berkeleyvision.org/gathered/examples/mnist.html。他們會比我所能解釋的更好。

但是對於標籤,有多種方法可以做到這一點。大多數情況下,圖像只是按文件夾分割。然後,1文件夾包含顯示數字1的圖像,文件夾2顯示數字2的圖像等等。然後你可以利用它來加載訓練數據。

但是,您也可以爲每個圖像創建一個標籤文件,並將相應的編號寫入標籤文件。然後你只需要知道名稱模式來查找標籤文件。

+0

我對如何分類有疑問。在cpp_classification(有問題)的鏈接中,他們使用了synset_words.txt這是一個標籤文件,其格式我不明白。你能更具體地瞭解標籤文件的格式嗎?它只是一個數字嗎? –

+0

此標籤文件與數字識別無關。它與imagenet上的對象檢測有關。它是從ID到對象類的映射,可以在這裏看到:http://image-net.org/download-API –

+0

雖然我無法理解如何在Imagenet中對圖像進行分類。那麼我實際需要什麼樣的文件來分類數字呢?我需要定義網絡的prototxt文件,所有權重和圖像的.caffemodel?是必需的mean_image文件還是僅在培訓期間使用? –

相關問題