我想通過使用分割信息來估計臉部的姿態 - 只有偏航角。簡而言之,臉部圖像已被分割爲「頭髮」,「皮膚」和「背景」像素。這些的基礎是可用的。面部大致居中。這個例子的例子是here。 剪影的臉部偏航角估計
試圖在訓練集500圖像上從分割圖像到偏航角度等級(最左邊= 1到最右邊= 500,比如說)進行迴歸。
我基本上想在這裏拋出一些想法並獲得一些反饋。 (希望這不會被視爲「無構造」)。
- 可以通過圖像左側有多少頭髮和皮膚像素 - 一些關於圖像中心軸的矩的形式可以看到偏航角的現成估計值。這種東西在paper中報道過。但實現它(基本上是一個二次迴歸方案,使用關於圖像中心垂直線的皮膚像素和頭髮像素矩)給出相當嘈雜的結果
我對卷積分神經網絡結構用於2類問題/非面部分類)訓練的左側姿勢和右側姿勢圖像。分類是相當不錯的〜70%的準確性,只有250個訓練和250個測試樣本。然而,迴歸到平滑變化的姿勢值再次給出相當嘈雜的結果
相當有利。考慮實現某種8方向鏈式編碼的直方圖,類似於HOG,而是用於分割圖像....或者可能使用傅立葉描述符對邊界進行編碼,並訓練神經網絡以學習分割和分割之間的非線性關係姿勢。
我可以針對這個問題得到一些反饋意見嗎?它是我正在做的一項獨立研究(足夠用我平常的領域 - OCR和文本檢測)。
公平點。面部標誌檢測和姿態估計從這裏是相當知名的。仍然在嘗試之前轉移到那 – AruniRC