0

我有一個英特爾奔騰雙T3200具有以下規格(與CPU-Z計算):獲取CPU峯值FP性能和延遲,以及DRAM帶寬和L1緩存

http://dl.dropboxusercontent.com/u/878621/specs.html

和lshw的輸出:

http://dl.dropboxusercontent.com/u/878621/lshw.html

我怎麼能計算時延和帶寬(在週期和MB/s)我的主內存的?和我的L1緩存? 我跑了一個benchamrk和l1緩存延遲是3個週期。我怎麼找到其餘的?

我的cpu的Peak FP性能如何?

+0

如果你想要一個工具,它有點偏離主題,如果你想以編程方式找到,只需編寫一個小於1M的L2的小鏈表基準測試,但它適合你的1G內存,並測量平均延遲。峯值BW比較棘手,測量來自兩個內核的並行連續訪問。請注意,DRAM訪問可能相差很多。 – Leeor

回答

1

使用lmbench,特別是基準lat_mem_rdbw_mem我得到的一切我需要計算延遲和帶寬..

使用LINPACK我計算了內部測試的一個山頂FP性能!

+0

CPU-Z緩存延遲工具使用與lmbench中的lat_mem_rd完全相同的方法。 FP性能的理論峯值應通過讀取您的CPU規格,所需格式的浮點加法和乘法(通常爲64位ieee加倍,對於通常爲32位浮點的GPU)在每個cpu時鐘中完成計算;然後乘以CPU頻率(然後乘以核心計數)。對於英特爾,通常每個時鐘的FP對於P4和Core來說都是2(64位);核心2爲4; 8用於早期的AVX CPU(Sandy,Ivy);用於AVX2的Haswell 16; XeonPhi 16和AVX512。 – osgx