3
這實際上是一個概念性問題 - 我一直在研究這個問題一段時間,但還沒有找到解決我的問題的好方法。我有一個hexagonal image with hexagonal binning/pixels,每個像素的黑白強度值,並試圖將其饋入一個深度自動編碼器,但似乎它們使用正方形或矩形圖像(正方形像素)。 請注意,此圖像是作爲一維數組,具有適當的x,y座標給出用於六角形(和分箱)圖像的神經網絡?
我已經想到並查看了一些想法來處理這種情況,並且正在尋找一些反饋或可以指向的信息我在正確的方向。
- 將六角形圖像轉換爲立方體。如果我們處理所有完整的六邊形像素,這將工作,但半單元(即半六邊形)使這不可能。
- 將六角形像素切成相等大小的像素(半六角形),以便我們可以將它們作爲「正方形」像素輸入。然而,半六角形的方向證明這是一個挑戰。我也想過把像素分成更小的三角形像素,但是我不知道如何處理這個問題。
- 添加白色像素(即全部爲0)並強制圖像看起來像一個矩形或正方形。但是,我不知道正方形和六邊形像素之間的關係。
- 將六角形像素變換爲方形像素,然後添加空白,使六角形圖像變成矩形圖像。這似乎是最可能的,我目前正在閱讀關於如何做到這一點的文章,但我不知道如何正確處理半六角像素。
我想廣義的問題是 -
我該如何處理時, 圖像既是非矩形和非矩形pixeled圖像送入神經網絡?
任何想法,將不勝感激。謝謝!
好吧,但是如果是半像素,我會將它們的數據值表示爲強度的一半,或者考慮到autoencoder只是想重現相同的值,幾何體是不會變的? 我正試圖將CNN應用到它,並與池。 – Kai
@Kai,給每個正方形像素分配任意值,位於與該像素中心對應的六邊形網格上的位置。這就像拍照。 –
嗨唐 - 好吧,但那麼我該如何處理非矩形圖像。上面鏈接的六邊形輪廓中的內容是圖像的實際內容(使圖像爲正方形的其他內容只是藝術家繪製的疊加層)。自編碼器中使用的張量是非矩形的,我認爲矩陣是不可能的。 – Kai