任何人都可以突出顯示NUMA多核體系結構中可以減少核心間通信的方式。案例研究Intel NEHALEM微架構。在NUMA體系結構中最大限度地減少核心間通信
1
A
回答
3
Nehalem處理器使用QuickPath Interconnect (QPI)進行處理器間/節點/包通信。在一個NUMA system中,每個節點都有自己的本地內存,它與系統中的其他節點共享。當程序的working set適合L1緩存並且是隻讀的時,NUMA節點擁有內存並不重要。當核心獲取緩存未命中並且內存由另一個節點擁有時,需要NUMA節點之間的通信。但是,這並不意味着訪問另一個節點所擁有的內存比較慢,這取決於另一個節點是否將其緩存在與其本地內存相關的緩存中,英特爾稱之爲最後級緩存(LLC)。核心訪問該節點本地的內存位置比訪問另一個節點擁有的內存要快,但是隻有在兩個節點上的LLC未命中時纔會訪問該內存。訪問另一個節點上LLC的內存比訪問本地節點上的內存要快,這是因爲內存比CPU慢得多,並且QPI針對這種通信進行了優化。大多數系統不打算試圖減少處理器之間的通信,因爲,正如你可以想象的那樣,這不是一個簡單的問題 - 它需要設置線程對內核的親和力,設置該線程的內存工作集與本地內存的親和性的節點。您可以在Drepper Ulrich's paper中閱讀更多關於此的內容,請搜索NUMA。在本文中,Ulrich將QPI稱爲通用系統接口(CSI),這是公佈之前的英特爾QPI名稱。
相關問題
- 1. 在部署期間最大限度地減少客戶中斷
- 2. 最大限度地減少HTML文件
- 3. 最大限度地減少結果重複的最佳方式
- 4. 結合documentfragment和replacechild最大限度地減少迴流
- 5. 最大限度地減少城市之間的旅行成本
- 6. 最大限度地減少移動的最大距離
- 7. 如何最大限度地減少在搜索結果中的URL鏈接
- 8. NUMA體系結構的有效使用
- 9. 在序列生成過程中最大限度地減少間隙的出現
- 10. ExtJS - 如何最大限度地減少roweditor的高度?
- 11. 最大限度地減少大負載數的算法
- 12. Angular + ASP.Net核心:插件體系結構
- 13. 核心庫的異常體系結構
- 14. PGRFileManager最大限度地減少在谷歌瀏覽
- 15. 呈現在PDFSharp和最大限度地減少內存佔用
- 16. 如何最大限度地減少搜索大文件的時間
- 17. html/CSS代碼以最大限度地減少網頁中的額外空間
- 18. 如何最大限度地減少GPU在Google眼鏡中的過度畫?
- 19. Angular Bootstrap Datepicker指令最大限度地減少html元素
- 20. MVC3如何最大限度地減少控制器
- 21. 最大限度地減少點擊聆聽者的代碼
- 22. 如何最大限度地減少輸入例外
- 23. 爲了最大限度地減少距離數字
- 24. Java數據庫最大限度地減少連接創建
- 25. 如何最大限度地減少對日誌的影響
- 26. 如何最大限度地減少報表
- 27. 最大限度地減少js時的吞嚥錯誤
- 28. 腳本最大限度地減少MySQL的InnoDB主鍵
- 29. 算法 - 最大限度地減少總的遲到
- 30. 如何最大限度地減少無邊界形式?
非常感謝你,將其作爲我的項目,並一直給我帶來很多頭痛。 –