1
我正在使用粒子模擬器,並且遇到了一點瓶頸,使用無人機寫入RWStructured單浮點緩衝區大約有10倍太慢。從實驗來看,似乎沒有帶寬的短缺,但只是訪問時間本身就讓它減少了。由於外發數據需要按照特定順序進行追加寫入,所以不存在問題。這是在DX10/SM4硬件上,所以這裏有幾個問題:是否有任何方法來加快速度(除了寫入更大的數據塊以來,因爲着色器的輸出不連續)?如果不是那麼DX11級別的硬件更快無人機?DirectCompute寫入緩衝區速度