intrinsics

    2熱度

    4回答

    我有這樣的代碼: __asm jno no_oflow overflow = 1; __asm no_oflow: 它生產這個漂亮的警告: 錯誤C4235:非標準擴展使用:不支持在此架構 '__asm' 關鍵字 會是什麼是這個代碼的等價/可接受的替代品來檢查之前發生的減法操作的溢出嗎?

    12熱度

    1回答

    _mm_mwait從pmmintrin.h是如何工作的? (我的意思是不是它的ASM,但動作和這個動作是如何採取NUMA系統該store監測是很容易實現只在與公交車的監聽總線爲基礎的SMP系統。) 什麼處理器不執行它? 它用於某些自旋鎖?

    7熱度

    6回答

    是否有任何可以加速Core i7架構上雙/整數矢量最小/最大值計算的asm指令? 更新: 我沒想到會這麼豐富的解答,謝謝。 所以我看到最大/最小值可能沒有分支。 我有子問題: 有沒有一種有效的方法來獲得最大的雙數的索引?

    10熱度

    4回答

    這與ARM霓虹燈SIMD編碼特別相關。我在視頻解碼器中爲某些模塊使用ARM Neon內置函數。我有一個矢量化的數據如下: 在氖燈寄存器中有四個32位元素 - 比方說Q0,它的大小爲128位。 3B 3A 1B 1A 在其他氖燈寄存器中還有另外四個32位元素,說Q1大小爲128位。 3D 3C 1D 1C 我想最終的數據是爲了如下圖所示: 1D 1C 1B 1A 3D 3C 3B 3A

    2熱度

    4回答

    我曾經見過這個宏,但從未真正知道它的目的。任何人都可以闡明這一點嗎?

    9熱度

    4回答

    以下代碼在GCC中調用clz/ctz的內置函數,並在其他系統上調用C版本。顯然,如果系統具有像x86和ARM這樣的內置clz/ctz指令,那麼C版本就不太理想。 #ifdef __GNUC__ #define clz(x) __builtin_clz(x) #define ctz(x) __builtin_ctz(x) #else static uint32_t ALWAYS_INLINE

    0熱度

    4回答

    我已經用螞蟻描繪了我的應用程序,發現> 10%在CRC32計算中。 (該CRC32-計算在普通的C#實現) 我做了一些谷歌搜索,並瞭解在Visual Studio 2008中的以下內在函數: _mm_crc32_u8 _mm_crc32_u16 _mm_crc32_u32 _mm_crc32_u64 (http://msdn.microsoft.com/en-us/library/bb514036