與內存交易的NVIDIA GPU性能計數器相關的子分區,扇區和DRAM單元是什麼?在NVIDIA GPU分析中,什麼是子分區,扇區和單元?
我正在尋找有關如何解釋下面的性能計數器信息:
fb_subp0_read_sectors:讀 請求數:發送到子分區中的所有DRAM單元fb_subp1_read_sectors的 0的讀請求數發送到所有DRAM單元 fb_subp0_write_sectors的子分區1:發送到所有DRAM單元fb_subp1_write_sectors的 子分區0的寫入請求的數量:數 發送到子分區1中的所有DRAM單元 fb0_subp0_read_sectors的讀請求的:r的數量EAD請求發送到DRAM單元0 fb0_subp1_read_sectors的 子分區0:發送到DRAM單元0 fb0_subp0_write_sectors的子分區1 讀取請求數:發送到DRAM單元0 fb0_subp1_write_sectors的 子分區0的寫入請求的數量:發送到DRAM單元1的子分區1的 寫入請求的數量 fb1_subp0_read_sectors:發送到DRAM單元1的子分區0的 子分區0的讀取請求的數量fb1_subp1_read_sectors:發送到DRAM單元1的子分區1的 讀取請求的數量 fb1_subp0_write_sectors:發送到DRAM單元1的子分區0的 的寫入請求的數量fb1_subp1_write_sectors:寫入請求的數量 sen t到DRAM單元1的子分區1
我檢查了NVIDIA Visual Profiler 5.0的文檔,但沒有在那裏找到任何附加信息。
我還沒有找到你提到的性能計數器的任何具體信息。我認爲他們提到的問題是[優化CUDA中的矩陣轉置](http://www.cs.colostate.edu/~cs675/MatrixTranspose.pdf)和論文中討論的分區駐留問題:限制GPU內核中的分區露營,但我相信你已經知道了。 – JackOLantern