2017-02-21 39 views
1

我是TensorFlow的新手。實際上,我在TensorFlow網站測試了一些分類的例子「卷積神經網絡」,它解釋瞭如何將輸入圖像分類到預定義的類中,但問題是:我無法弄清楚如何檢測同一圖像中的多個對象。例如,我有一個貓和狗的輸入圖像,我希望我的圖表在輸出中顯示它們都是圖像中的「貓和狗」。如何識別同一圖像中的多個對象

回答

5

偉大的問題。檢測同一圖像中的多個對象沸騰本質上是一個「分割問題」。兩種不錯的和流行的算法是 YOLO(你只看一次)和SSD(單發多盒檢測器)。我在底部包含了他們的鏈接。

我會觀看關於YOLO如何工作的一些視頻,並看看你是否掌握了這個想法。然後閱讀SSD上的論文,看看你是否明白爲什麼這個算法更快,更精確。

這兩種算法都是單遍的:他們只看圖像「一次」,並預測它們發現的類別的邊界框。有更精確的算法,但它們較慢(他們首先選擇許多他們想要看的點,然後僅在該點上運行分類器,結果是他們每個圖像多次運行該分類器,這很慢)。

正如你所說你是Tensorflow的新手,你可以嘗試其他人的代碼:https://github.com/thtrieu/darkflow。非常廣泛的自述向您展示瞭如何開始使用自己的數據集。

祝你好運,讓我們知道你是否有其他問題,或者如果這些算法不符合你的使用案例。

+0

明智的答案和你提供的鏈接是現貨!我已經把賞金賞給了你。非常感謝您分享您的專家在這個主題! – JohnV

1

爲你正在嘗試做的是獨立分類部分圖像天真的方法。

但是有一些更好的技術用於對象檢測。實際上,有TensorFlow Object Detection API,它允許您訪問最常見的對象檢測方法,如Faster R-CNN或SSD。

相關問題