2013-10-02 59 views
6

我能夠在Processor Comparison中找到至強E5-2690的理論DP峯值性能371GFlop/s(有趣的是,在英特爾競爭對手中找到此信息比英特爾支持網頁本身更容易)。然而,當我試圖推導出峯值性能我推導不匹配:如何獲得英特爾至強E5-2690的GFlop/s峯值性能?

  1. 頻率(在Turbo模式)的至強E5-2690 3.8GHz的=
  2. 處理器可以做的每個核心每個週期addmul操作,所以我們得到:3.8×2 = 7.6
  3. 由於它具有AVX支持,它可以爲每個循環做4個雙操作:7.6×4 = 30.4
  4. 最後,它擁有8個內核,因此我們得到:8×30.4 = 243.2

因此,Gflop/s的峯值性能是243.2 GFlop/s而不是371 GFlop/s?

+0

您從哪裏找到該處理器可以在一個週期內執行ADD和MUL操作的信息?這是熔合乘法加法(FMA)技術嗎? –

回答

5

Turbo Mode不用於計算Theoretical Peak Performance,你必須要考慮是這樣的:

CPU速度= 2.9 GHz的

CPU內核每個週期= 8

CPU指令= 8(考慮AVX- 256 - > 256位單元,可以保持8個單精度值)x 2(像你說的添加和多個操作)= 16

放在一起:

2.9x8x16 = 371 GFlops/s

+0

然後指出您計算單精度理論峯值,而我的計算是+/-正確的,以計算除Turbo模式點之外的雙精度理論峯值並使用2.9 Ghz,這一點非常重要。 –

+0

使用所有CPU核心時,Turbo模式通常不適用。使用AVX max DP GFLOPS將爲185.5。 –

+0

Flops =每秒浮動操作數 – Arthur

相關問題