2013-07-22 90 views
3

AVX2採集延遲是否有任何數據?有沒有關於AVX2收集指令的延遲的數據?

(例如一個_mm256_i32gather_ps指令訪問單個高速緩存行)

+1

只是一個經驗數據點 - 我最近爲一個聚集的負載運行了一個快速基準,吞吐量非常糟糕 - 我加載了一個分裂向量,所以向量的前半部分來自一個緩存行,第二個一半 - 另一半 - 似乎需要幾個週期。 –

回答

1

本頁提供延時數據的所有內部函數:

Intel Intrinsics Guide

爲_mm256_i32gather_ps的潛伏期爲6

+0

注:這些是最小延遲。 – hdl