3

這實際上是一個概念性問題 - 我一直在研究這個問題一段時間,但還沒有找到解決我的問題的好方法。我有一個hexagonal image with hexagonal binning/pixels,每個像素的黑白強度值,並試圖將其饋入一個深度自動編碼器,但似乎它們使用正方形或矩形圖像(正方形像素)。 請注意,此圖像是作爲一維數組,具有適當的x,y座標給出用於六角形(和分箱)圖像的神經網絡?

我已經想到並查看了一些想法來處理這種情況,並且正在尋找一些反饋或可以指向的信息我在正確的方向。

  • 將六角形圖像轉換爲立方體。如果我們處理所有完整的六邊形像素,這將工作,但半單元(即半六邊形)使這不可能。
  • 將六角形像素切成相等大小的像素(半六角形),以便我們可以將它們作爲「正方形」像素輸入。然而,半六角形的方向證明這是一個挑戰。我也想過把像素分成更小的三角形像素,但是我不知道如何處理這個問題。
  • 添加白色像素(即全部爲0)並強制圖像看起來像一個矩形或正方形。但是,我不知道正方形和六邊形像素之間的關係。
  • 將六角形像素變換爲方形像素,然後添加空白,使六角形圖像變成矩形圖像。這似乎是最可能的,我目前正在閱讀關於如何做到這一點的文章,但我不知道如何正確處理半六角像素。

我想廣義的問題是 -

我該如何處理時, 圖像既是非矩形和非矩形pixeled圖像送入神經網絡?

任何想法,將不勝感激。謝謝!

回答

1

我沒有看到任何問題重新採樣它與規則的正方形網格,以便它成爲一個適當的二維圖像。無論如何,您可能需要這樣做才能保持網絡規模合理。

+0

好吧,但是如果是半像素,我會將它們的數據值表示爲強度的一半,或者考慮到autoencoder只是想重現相同的值,幾何體是不會變的? 我正試圖將CNN應用到它,並與池。 – Kai

+0

@Kai,給每個正方形像素分配任意值,位於與該像素中心對應的六邊形網格上的位置。這就像拍照。 –

+0

嗨唐 - 好吧,但那麼我該如何處理非矩形圖像。上面鏈接的六邊形輪廓中的內容是圖像的實際內容(使圖像爲正方形的其他內容只是藝術家繪製的疊加層)。自編碼器中使用的張量是非矩形的,我認爲矩陣是不可能的。 – Kai