GPU - 系統內存映射

系統內存（RAM）如何映射以進行GPU訪問？我很清楚虛擬內存是如何工作在CPU上的，但我不確定當GPU訪問GPU映射系統內存（主機）時該如何工作。基本上與數據如何從系統內存複製到主機內存有關，反之亦然。你能否提供參考文章支持的解釋？GPU - 系統內存映射

來源

2012-07-06 Abhinav

我發現下面的slideset非常有用：聚變APUS 零拷貝皮埃爾Boudier AMD 研究員的OpenGL/OpenCL的格雷厄姆賣方 AMD 經理的OpenGL

的好處 http://developer.amd.com/afds/assets/presentations/1004_final.pdf

存儲器系統

AMD Fusion Developer Summit 2011年6月

但請注意，這是一個快速移動的REA。與（最終）將諸如虛擬內存這樣的概念應用於GPU相比，並不是開發新概念。讓我總結一下。

在過去，比如2010年之前，GPU通常是獨立的PCI或PCI -presspress卡或主板。他們在GPU卡上安裝了一些DRAM。這種機載DRAM速度非常快。他們也可以通過PCI上的DMA拷貝引擎訪問CPU端的DRAM。 GPU像這樣訪問CPU內存通常很慢。

GPU內存未被分頁。對於這個問題，GPU內存通常是未緩存的，除了GPU內的軟件管理緩存之外，就像紋理緩存一樣。「軟件管理」意味着這些緩存不是緩存一致的，必須手動刷新。

通常，只有一小部分CPU DRAM被GPU訪問 - 一個光圈。通常，它被固定 - 不受分頁。通常，甚至不受虛擬地址轉換的影響 - 通常是虛擬地址=物理地址，也可能是一些偏移量。（當然，CPU內存的其餘部分是正確的虛擬內存，分頁，翻譯和緩存，只是GPU不能安全地訪問它，因爲GPU確實（沒有）訪問虛擬內存子系統和高速緩存一致性系統

現在，上述工作，但它是一個痛苦。在CPU內部的第一件事，然後在GPU內部運行緩慢。容易出錯。並且很大的安全風險：用戶提供的GPU代碼經常可以訪問（緩慢和不安全）所有CPU DRAM，因此可能被惡意軟件使用

AMD已經宣佈了一個更緊密集成GPU和CPU的目標，其中一個步驟是創建「融合」APU，包含CPU和GPU的芯片。（英特爾已經完成了與Sandybridge的類似工作;我期望ARM也這樣做）。

AMD也宣佈他們打算讓GPU使用虛擬內存子系統並使用緩存。 AMD IOMMU向使GPU使用虛擬內存的方向邁出了一步。英特爾有類似的。儘管IOMMU更多地面向虛擬機，而非虛擬機操作系統的虛擬內存。

CPU和GPU位於同一芯片內的系統通常使CPU和GPU訪問相同的DRAM芯片。所以不再有「GPU上」和「GPU外」的DRAM。

但是，系統主板上的DRAM通常仍然存在拆分，分區到主要由CPU使用的內存以及主要由GPU使用的內存。即使內存可能存在於相同的DRAM芯片內部，通常很大一塊是「圖形」。在上面的文件中，由於歷史原因，它被稱爲「本地」內存。 CPU和圖形內存可能會有不同的調整 - 通常GPU內存的優先級較低，除了視頻刷新，並具有較長的突發。

在本文中，我指的是，有不同的內部總線：洋蔥爲「系統」內存，「大蒜」爲更快訪問圖形內存分區。大蒜內存通常是未緩存的。

我提到的論文討論了CPU和GPU如何具有不同的頁表。他們的副標題「零複製的好處」是指將CPU數據結構映射到GPU頁面表中，這樣就不需要複製它。

等等等等，

系統的這個區域正在迅速發展，所以2011年的文件已經過時差不多。但是你要注意趨勢

（一）軟件WANTS統一訪問CPU和GPU內存 - 虛擬內存和緩存

但

（B），雖然硬件試圖提供（一），特殊圖形內存功能幾乎總是可以製作專用的圖形內存，即使只是相同DRAM的一個分區，顯着更快或更省電。

差距可能在縮小，但是每當您認爲它即將消失時，就可以播放另一個硬件技巧。

來源

2012-08-06 23:23:08

GPU - 系統內存映射

回答

相關問題