3
我想完全瞭解PTXAS -v
CUDA的內核堆棧使用情況和註冊溢出(適用於sm_35體系結構)的信息。對於我的內核之一它產生:瞭解CUDA內核堆棧使用情況並註冊溢出
3536 bytes stack frame, 3612 bytes spill stores, 6148 bytes spill loads
ptxas info : Used 255 registers, 392 bytes cmem[0]
我知道堆棧幀的本地存儲器,物理生活在那裏的全局內存是,是對每個線程專用分配。
我的問題是:
- 是需要的寄存器溢出也被分配在本地內存 內存?
- 寄存器溢出和堆棧所需的內存總量爲 ,等於[線程數量] x [3536字節]。因此,寄存器 溢出加載/存儲操作堆棧幀?
- 溢出商店/負載的數量沒有詳細說明 傳輸的大小。這些總是32位寄存器嗎?因此,一個64位浮點數的溢出會被計爲2個溢出存儲?
- 溢出存儲/加載緩存在L2緩存中嗎?
可能部分在這裏回答:http://stackoverflow.com/questions/12388207/interpreting-output-of-ptxas-options-v – njuffa
我讀了這個帖子。這部分回答。但是這並不能證明我們可以解決這個問題。見下面的評論。 – ritter