2012-11-21 24 views
1

我正在做關於GPU上一些CUDA加速的項目,並完成了一些軟件級別的優化計算,並且我發現GPU架構中的一些更改可能會進一步優化項目。GPU架構定製?

現在我的問題是,有沒有一種有效的方式或存在的模擬器讓我改變GPU架構中的某些功能或部件,然後我可以在該定製架構上對CUDA PTX代碼進行基準測試,以獲得性能結果(更好循環精確)?有幾種CPU架構模擬器,所以我想知道它們中的一些是否可以支持GPU? 或者我可能必須自己編寫一個GPU模擬器^ _ ^?

回答

3

您正在準確尋找GPGPU-sim。該模擬器可以準確模擬NVIDIA GPU,並在代碼中執行OpenCL和CUDA工作負載而無需修改。我想也可以選擇模擬PTX工作負載。從manual

GPGPU-Sim的3.x的運行被由CPU部分 和GPU部分的程序二進制文件。但是,GPGPU-Sim 3.x中的微體系結構(時序)模型報告GPU忙的週期 - 它不是 模型CPU時序或PCI Express時序(即CPU與GPU之間的存儲器傳輸時間 )。

GPGPU-sim可廣泛配置,可讓您對不同的微架構建模。例如,您可以調整手冊中解釋的SM,warp調度程序,SIMD組,每個SM的線程數,共享內存大小,寄存器文件大小以及許多其他參數。在仿真結束時,仿真器轉儲執行持續時間(在GPU時鐘週期中)以及許多其他性能計數器。

進一步的信息:

GPU Ocelot是PTX分析器。在以前的版本中,您可以模擬工作負載。但是,最近的版本着重於PTX代碼的編譯器優化。

MacSimMacSim是另一個複雜而強大的工具,模擬CPU和GPU的異構系統。