我正在試圖製作高斯模糊圖像濾波器的移動快速版本。 我讀過其他的問題,比如:Fast Gaussian blur on unsigned char image- ARM Neon Intrinsics- iOS Dev 對於我的目的,我只有一個固定大小(7×7)固定西格馬(2)高斯濾波器需要。因此,在針對ARM NEON進行優化之前,我正在C++中實現一維高斯內核,並直接在移動環境(Android
我需要將uint8數組中的值加載到128個NEON寄存器中。有一個類似的question。但是沒有好的答案。 我的解決辦法是: uint8_t arr[4] = {1,2,3,4};
//load 4 of 8-bit vals into 64 bit reg
uint8x8_t _vld1_u8 = vld1_u8(arr);
//convert to 16-bit and move
我有一個8位的640×480的圖像,我想縮小到320×240的圖像: void reducebytwo(uint8_t *dst, uint8_t *src)
//src is 640x480, dst is 320x240
會是什麼做的,使用ARM的最佳方式SIMD NEON?任何示例代碼? 作爲一個起點,我只是想這樣做相當於: for (int h = 0; h < 240; h++)