識別圖像中的複雜對象

我將更具體地瞭解這種情況：識別圖像中的複雜對象

我已經捕獲了遊戲DotA的屏幕截圖。我想得到的信息是什麼對象，例如。英雄（也叫它的名字，hp，...），爬行者（也是哪一邊），塔樓等在圖像中和他們所在的位置都可見。一個問題來自於這樣的事實：在DotA 2中，許多這些對象都可以從多個角度查看，所以讓我們減少問題並假定每個對象只有一個方向。這個問題如何能夠快速解決，它可以以大約30fps的速度實時識別所有對象？歡迎任何幫助或建議。

來源

2016-03-25 user4034932

我認爲你有好的標誌：圖像分割CNN。所以我的觀點是，對於來自不同視角和尺度的許多不同對象（因爲我猜你可以放大/縮小你的英雄/對象），最簡單的方法（但計算方面最重）是構建每種類型的對象都有一個CNN。

但是圖像會幫助我們更好地理解問題。

來源

2016-03-25 03:26:36 FiReTiTi

據我所知，CNN只能確定一個對象是否存在於圖像中，而不是圖像中所關注的對象所在的位置。這也是我想從截圖中提取的信息。 CNN是否真的有能力回答這個問題？ – user4034932

CNN會告訴你哪個像素屬於對象，所以它也會給你在圖像中的位置。 – FiReTiTi

要明確，您建議採用哪種解決方案？ 1：首先從圖像中提取感興趣的對象，然後將每個對象提供給CNN以找出它們是哪種對象。在這種情況下，我如何提取這些對象？由於它們不是單色的物體，因此我並不真正瞭解這項工作的算法。 2：將整個屏幕截圖送入CNN，CNN將輸出對象所在的位置以及它們是什麼類型的對象。在這種情況下，我從來不知道可以執行這樣的任務的CNN存在。一些更多的信息或鏈接將是非常有用的。謝謝。 – user4034932

識別圖像中的複雜對象

回答

相關問題