4

我正在嘗試結束檢測(本地化)圖像中的對象的統一模型。對象本身可以有多種類型,如「野外文本」,但對象的周圍特徵應該確定感興趣區域的位置。如何使用張量流中的CNN特徵進行對象檢測?

就像檢測人臉一樣,不考慮臉部本身的特徵。即它在脖子上的某種憤怒距離。

我期待的輸出是對象的座標,或像圖像網格格式來生成邊界框,如:[xmin,ymin,xmax,ymax] 我有一個包含500個圖像的數據集。基於周圍特徵的張量流中有物體檢測的例子嗎?即來自conv1或conv2的特徵圖。 ?

回答

4

有物體檢測/定位,你可以檢查出Tensorflow基礎的框架: https://github.com/Russell91/TensorBox

雖然,我不知道這500張圖片就足以成功地重新訓練提供模型(一個或多個)。