2017-04-17 35 views
0

我無法解釋它。這是段落(最後兩行對我的問題非常重要)。如何在迴歸對應於旋轉矩形的值時決定角度?

我們探索的最簡單的模型是從原始RGB-D圖像的 直接回歸到掌握座標。原始圖像爲 ,該模型使用卷積圖層從圖像中提取 特徵。完全連接的層在輸出層中終止於 ,其中六個輸出神經元對應於抓握的座標 。四個神經元的位置和高度對應 。 抓取角度是雙重旋轉對稱的,所以我們通過使用兩個額外的座標來進行參數化:兩倍角度的正弦和餘弦。

粗線的含義是什麼?

更詳細點,

首先,爲什麼兩倍角?

二:什麼是雙重旋轉對稱?

第三:爲什麼我不能直接回歸角?

這一段是從這個paper - 第2頁,右側欄,B節

+0

您是否可以添加對您在問題中引用的段落的引用? –

+0

@JamesPhillips - 完成。 – talos1904

回答

0

第二個問題是在這裏找到答案:http://mathstat.slu.edu/escher/index.php/Rotational_Symmetry,並按照我的理解,這意味着一個360度的圓內的對象可以旋轉兩次並且在視覺上看起來相同。由於論文的主題是機器人視覺,旋轉45度的抓取矩形看起來與旋轉(180 + 45)度的矩形相同。

第一個和第三個問題:看起來,本文提到的神經網絡可能直接將角度用作輸入。由於旋轉對稱性,機器人視覺只能解決抓取矩形的180度旋轉,並且對於神經網絡的神經元輸入範圍將正弦和餘弦輸出增加到360度,所檢測到的視覺旋轉角被加倍爲一個形式的數據調節。