2016-04-08 58 views
1

我明白如何做分類問題,並開始理解卷積網絡,我認爲這在某種程度上是答案。我對如何設置網絡來給我輸出位置有點困惑。如何讓神經網絡給位置?

讓我們假設你有一個數據集面對鼻子的終點的位置。要找到結束點,你只需要做一個'分類'類型的問題,其中你的輸出層類似於64x64 = 4096點,但如果鼻子在網格的第43行和第20列,則只需將輸出設置爲全零因爲在元素43 * 64 + 20 = 2772你在哪裏設置它等於1?然後將其映射回您的圖像尺寸。

我無法找到關於這部分身份識別是如何工作的信息,這是我最好的猜測。我正在用這種方法學在第二個項目中工作,但這將會是很多工作,並且想知道我是否至少在正確的軌道上。這似乎是一個解決的問題,但我似乎無法找到人們如何做到這一點。

回答

1

儘管您描述的內容可行,但通常神經網絡(卷積等)不用於確定圖像中某個特徵的位置。尤其是,卷積神經網絡(CNN)專門設計爲平移不變量,因此它們將檢測特徵而不管它們在輸入圖像中的位置 - 這與您正在尋找的內容相反。

您所描述的問題的一種常見和有效的解決方案是級聯分類器。他們有一些限制,但是對於你描述的那種應用程序來說,它可能工作得很好。特別是,級聯分類器的設計旨在提供良好的性能,這是由於分階段的方法,輸入圖像的大部分區域在第一個階段很快就被解散了。

不要誤解我的意思,嘗試使用您描述的方法可能會很有趣。只是要意識到它可能很難讓它很好地擴展。

+1

我的閱讀論文似乎表明他們在使用基於迴歸的方法論之後對其進行了更多的研究。基本上有神經網絡來計算位置,並使用卷積網對計算中的非線性效應進行計算。 我打算嘗試面部標誌識別,並且在那個領域有很多工作,他們只用神經網絡就可以獲得很好的效果,而且級聯分類器稍微不挑剔。我當然也在研究級聯分類器,他們考慮使用兩級攻擊和神經網絡。 – user2927848

+1

兩階段的方法在我的經驗中表現得相當出色。基本上,我使用級聯分類器首先識別目標特徵的可能位置,然後使用更昂貴的神經網絡推斷來獲得對這些識別位置之一的置信度。一般而言,對於神經網絡,我使用CNNs,因爲卷積層提供了一種便捷的方式來從圖像中提取重要特徵,而無需過多的手動預處理。 – Aenimated1

+1

我的級聯分類器的一個問題是,它們看起來非常挑剔,在opencv中。是否有可能訓練一些不具有旋轉變體並且從多個角度工作的人?還是有必要與多個角度的多個分類器運行幾次通過,以確保你抓住了臉? – user2927848