5

經過幾個月的工作,我已經能夠成功地訓練自己的模型。例如,比我自己的模型更進一步,我已經能夠用1000個班級培訓ImageNet。試圖訓練區域CNN(R-CNN)的ImageNet模型

在我現在的項目中,我試圖提取我感興趣的類的區域。之後,我編譯並運行了Fast R-CNN的演示程序,它可以正常工作,但示例模型僅包含20個類,我希望有更多類,例如所有類。

我已經下載了ImageNet的bounding boxes以及真實圖像。

現在,我已經空白了,我無法弄清楚接下來的步驟,也沒有關於如何去做的文檔。我唯一發現的是如何訓練INRIA人模型,他們提供了數據集+註釋+ python腳本。

我的問題是:

  • 有可能任何教程或指南,我已經錯過了?
  • 是否已經有一個可以分類圖像並提取邊界框的1000類訓練模型?

非常感謝您提前。

問候。

Rafael。

回答

4

Dr Ross Girshik在物體檢測方面做了很多工作。您可以從他詳細的git fast RCNN中瞭解到很多:您應該可以在那裏找到一個caffe分支,並附帶演示。我自己並沒有使用它,但似乎很容易理解。

您可能會感興趣的另一個方向是LSDA:使用弱監督來訓練許多類的對象檢測。你是否看過faster-rcnn

+0

你好@Shai,謝謝你的回答。說實話,我並不瞭解LSDA或者更快的rcnn,我會快速看一下他們兩個。 LSDA似乎很清楚。 Ross Girshik的git的一點是我無法理解如何訓練,因爲沒有像常規Caffe那樣的「下載設置」,它只允許下載20級預訓練模型或火車模型..如果你提到的東西是「清晰的」,我會更深入地瞭解一下,因爲也許我通過了一些我需要的細節......將會看到其餘的框架,並且會更新答案。謝謝! –

+0

@RafaelRuiz AFAIK fast-rcnn git有一個基於VOC註釋的訓練腳本(以python爲例),我相信(=我沒有自己嘗試過),它也可以改爲與其他註釋集一起工作。 – Shai

+0

我會試一試,非常感謝。我現在已經看到了這個腳本,但是我和其他文檔比如INRIA人模型混淆了:\ –

相關問題