如何識別同一圖像中的多個對象

我是TensorFlow的新手。實際上，我在TensorFlow網站測試了一些分類的例子「卷積神經網絡」，它解釋瞭如何將輸入圖像分類到預定義的類中，但問題是：我無法弄清楚如何檢測同一圖像中的多個對象。例如，我有一個貓和狗的輸入圖像，我希望我的圖表在輸出中顯示它們都是圖像中的「貓和狗」。如何識別同一圖像中的多個對象

來源

2017-02-21 user3425890

偉大的問題。檢測同一圖像中的多個對象沸騰本質上是一個「分割問題」。兩種不錯的和流行的算法是 YOLO（你只看一次）和SSD（單發多盒檢測器）。我在底部包含了他們的鏈接。

我會觀看關於YOLO如何工作的一些視頻，並看看你是否掌握了這個想法。然後閱讀SSD上的論文，看看你是否明白爲什麼這個算法更快，更精確。

這兩種算法都是單遍的：他們只看圖像「一次」，並預測它們發現的類別的邊界框。有更精確的算法，但它們較慢（他們首先選擇許多他們想要看的點，然後僅在該點上運行分類器，結果是他們每個圖像多次運行該分類器，這很慢）。

正如你所說你是Tensorflow的新手，你可以嘗試其他人的代碼：https://github.com/thtrieu/darkflow。非常廣泛的自述向您展示瞭如何開始使用自己的數據集。

祝你好運，讓我們知道你是否有其他問題，或者如果這些算法不符合你的使用案例。

YOLO 9000（https://pjreddie.com/darknet/yolo/）
SSD（單發多光碟探測器）（https://arxiv.org/abs/1512.02325）

來源

2017-07-18 06:34:03 rmeertens

明智的答案和你提供的鏈接是現貨！我已經把賞金賞給了你。非常感謝您分享您的專家在這個主題！ – JohnV

爲你正在嘗試做的是獨立分類部分圖像天真的方法。

但是有一些更好的技術用於對象檢測。實際上，有TensorFlow Object Detection API，它允許您訪問最常見的對象檢測方法，如Faster R-CNN或SSD。

來源

2017-07-18 06:45:11 rettenda

如何識別同一圖像中的多個對象

回答

相關問題