4
我正在嘗試結束檢測(本地化)圖像中的對象的統一模型。對象本身可以有多種類型,如「野外文本」,但對象的周圍特徵應該確定感興趣區域的位置。如何使用張量流中的CNN特徵進行對象檢測?
就像檢測人臉一樣,不考慮臉部本身的特徵。即它在脖子上的某種憤怒距離。
我期待的輸出是對象的座標,或像圖像網格格式來生成邊界框,如:[xmin,ymin,xmax,ymax] 我有一個包含500個圖像的數據集。基於周圍特徵的張量流中有物體檢測的例子嗎?即來自conv1或conv2的特徵圖。 ?