我明白如何做分類問題,並開始理解卷積網絡,我認爲這在某種程度上是答案。我對如何設置網絡來給我輸出位置有點困惑。如何讓神經網絡給位置?
讓我們假設你有一個數據集面對鼻子的終點的位置。要找到結束點,你只需要做一個'分類'類型的問題,其中你的輸出層類似於64x64 = 4096點,但如果鼻子在網格的第43行和第20列,則只需將輸出設置爲全零因爲在元素43 * 64 + 20 = 2772你在哪裏設置它等於1?然後將其映射回您的圖像尺寸。
我無法找到關於這部分身份識別是如何工作的信息,這是我最好的猜測。我正在用這種方法學在第二個項目中工作,但這將會是很多工作,並且想知道我是否至少在正確的軌道上。這似乎是一個解決的問題,但我似乎無法找到人們如何做到這一點。
我的閱讀論文似乎表明他們在使用基於迴歸的方法論之後對其進行了更多的研究。基本上有神經網絡來計算位置,並使用卷積網對計算中的非線性效應進行計算。 我打算嘗試面部標誌識別,並且在那個領域有很多工作,他們只用神經網絡就可以獲得很好的效果,而且級聯分類器稍微不挑剔。我當然也在研究級聯分類器,他們考慮使用兩級攻擊和神經網絡。 – user2927848
兩階段的方法在我的經驗中表現得相當出色。基本上,我使用級聯分類器首先識別目標特徵的可能位置,然後使用更昂貴的神經網絡推斷來獲得對這些識別位置之一的置信度。一般而言,對於神經網絡,我使用CNNs,因爲卷積層提供了一種便捷的方式來從圖像中提取重要特徵,而無需過多的手動預處理。 – Aenimated1
我的級聯分類器的一個問題是,它們看起來非常挑剔,在opencv中。是否有可能訓練一些不具有旋轉變體並且從多個角度工作的人?還是有必要與多個角度的多個分類器運行幾次通過,以確保你抓住了臉? – user2927848