我一直在探索的神經網絡,並已能夠成功地培養出網絡甚至對我自己的形象在某種程度上標示個別的圖片作爲某些事情,但不知道如何使用的培訓網絡,以確定和可能的回報來自一個圖像的多個對象。例如,如果你受過訓練的貓,狗,和一個圖像有多個貓,狗,你會如何運用訓練的網絡,並返回自己的位置(圖中)?如何使用訓練的神經網絡來識別圖像中的多個對象?
這裏是主要的教程中我也跟着在Python實現:http://machinelearningmastery.com/object-recognition-convolutional-neural-networks-keras-deep-learning-library/
一般的答案就足夠了,如,是在圖片上滑動窗口爲這個最好的解決方案或者是有什麼更容易嗎?
一個具體的例子(尤其是在python),將不勝感激。 我已經使用了大部分的圖像工作的matplotlib,所以我更願意呆在從PIL切片了。
謝謝!
Thanks NKU - 我之前讀過滑動規則,是的複雜性和處理要求似乎不現實。我會看看其他預處理技術來限制計算時間。 – Beutler