2012-06-12 121 views
1

我正在使用粒子模擬器,並且遇到了一點瓶頸,使用無人機寫入RWStructured單浮點緩衝區大約有10倍太慢。從實驗來看,似乎沒有帶寬的短缺,但只是訪問時間本身就讓它減少了。由於外發數據需要按照特定順序進行追加寫入,所以不存在問題。這是在DX10/SM4硬件上,所以這裏有幾個問題:是否有任何方法來加快速度(除了寫入更大的數據塊以來,因爲着色器的輸出不連續)?如果不是那麼DX11級別的硬件更快無人機?DirectCompute寫入緩衝區速度

回答

0

第一件事(如果您還沒有完成),配置您的着色器代碼,是將GPU查詢添加到您的系統。這裏是一個鏈接來解釋它:

http://mynameismjp.wordpress.com/2011/10/13/profiling-in-dx11-with-queries/

它在DX11,但特點是在DX10太多,所以它應該是非常簡單的端口上。

經過計算有不同的方面,但首先一個會玩:

[numthreads(TGX, 1, 1)] 

嘗試值像8,16,32,64,並試圖找到甜蜜點(不要忘了除你的派遣)。