2016-03-25 59 views
0

我將更具體地瞭解這種情況:識別圖像中的複雜對象

我已經捕獲了遊戲DotA的屏幕截圖。我想得到的信息是什麼對象,例如。英雄(也叫它的名字,hp,...),爬行者(也是哪一邊),塔樓等在圖像中和他們所在的位置都可見。一個問題來自於這樣的事實:在DotA 2中,許多這些對象都可以從多個角度查看,所以讓我們減少問題並假定每個對象只有一個方向。這個問題如何能夠快速解決,它可以以大約30fps的速度實時識別所有對象?歡迎任何幫助或建議。

回答

1

我認爲你有好的標誌:圖像分割CNN。所以我的觀點是,對於來自不同視角和尺度的許多不同對象(因爲我猜你可以放大/縮小你的英雄/對象),最簡單的方法(但計算方面最重)是構建每種類型的對象都有一個CNN。

但是圖像會幫助我們更好地理解問題。

+0

據我所知,CNN只能確定一個對象是否存在於圖像中,而不是圖像中所關注的對象所在的位置。這也是我想從截圖中提取的信息。 CNN是否真的有能力回答這個問題? – user4034932

+0

CNN會告訴你哪個像素屬於對象,所以它也會給你在圖像中的位置。 – FiReTiTi

+0

要明確,您建議採用哪種解決方案? 1:首先從圖像中提取感興趣的對象,然後將每個對象提供給CNN以找出它們是哪種對象。 在這種情況下,我如何提取這些對象?由於它們不是單色的物體,因此我並不真正瞭解這項工作的算法。 2:將整個屏幕截圖送入CNN,CNN將輸出對象所在的位置以及它們是什麼類型的對象。 在這種情況下,我從來不知道可以執行這樣的任務的CNN存在。一些更多的信息或鏈接將是非常有用的。謝謝。 – user4034932