1

我正在使用Tensorflow's object detection API構建RCNN檢測網絡。是否應該包含Tensorflow對象檢測API的否定示例?

我的目標是檢測戶外視頻中動物的邊界框。大多數框架沒有動物,只有動態背景。

大多數教程都側重於培訓自定義標籤,但未提及負面訓練樣本。這些類別的檢測器如何處理不包含感興趣對象的圖像?它只輸出一個低概率,還是會強制嘗試在圖像中繪製邊界框?

我目前的計劃是在opencv中使用傳統的背景減法來生成潛在的幀並將它們傳遞給訓練好的網絡。我是否還應該將一類「背景」邊框包含爲「負面數據」?

最後的選擇是使用opencv進行背景減除,RCNN生成邊界框,然後使用作物的分類模型來識別動物與背景。

回答

1

通常沒有必要明確包含「負面圖像」。這些檢測模型會發生什麼,他們將圖像中不屬於註釋對象的部分作爲底片使用。

+0

感謝您的思考(以及API方面的傑出工作),只需要清楚,當面對沒有目標對象的圖像時,單個類別探測器的預期行爲是什麼?低概率分數?覆蓋整個框架的邊界框? – bw4sz

+0

在這種情況下的希望是沒有框會被退回:) –

0

如果你期望你的模型區分「找到一個數字」和「沒有數字」,那麼你幾乎肯定需要在負面的例子上進行訓練。將這些標記爲「無圖像」。在「無圖像」的情況下,是的,使用整個圖像作爲邊界框;不建議模型認識到更小的東西。

在「無圖像」的情況下,您可能會得到一個較小的邊界框,但這並不重要:在推理中,您將簡單地忽略任何返回「無圖像」的框。

當然,這裏的關鍵問題是嘗試一下,看看它對你有多好。

相關問題