通過優秀的設計減少緩存未命中數

如何在設計C++程序時減少可能的緩存未命中數？通過優秀的設計減少緩存未命中數

內聯函數是否每次都有幫助？或者只有當程序是CPU有界的時候（即程序是面向計算的而不是面向I/O的）纔是好的？

2009-01-20 Josef

以下是我在處理這類代碼時需要考慮的一些事情。

考慮您是否想要「結構的數組」或「結構數組」。你想要使用的將取決於數據的每一部分。
嘗試將結構保持爲32個字節的倍數，以便均勻地打包緩存行。
在冷熱元素中對數據進行分區。如果你有一組o類的對象，並且你經常一起使用ox，oy，oz，但偶爾需要訪問oi，oj，那麼請考慮將ox，oy和oz放在一起，然後移動i，j和k部分到平行的腋窩數據結構。
如果您有多維數據數組，然後使用通常的行順序佈局，則沿着首選維度掃描時訪問速度會非常快，而在其他位置掃描時會非常緩慢。沿着任何維度遍歷時，沿着space-filling curve映射它將有助於平衡訪問速度。（阻塞技術是相似的 - 它們只是具有較大基數的Z階。）
如果您必須導致緩存未命中，請嘗試儘可能多地使用該數據來分攤成本。
你在做什麼多線程？注意緩存一致性協議的減速。填充標誌和小計數器，以便它們位於單獨的緩存行中。
英特爾的SSE提供了一些預取內在函數，前提是您知道提前訪問的內容。

2009-01-20 10:49:24 Boojum

+1。希爾伯特曲線的想法是非常新穎的，你在哪裏提出的？是否需要在希爾伯特曲線座標和標準數組座標之間來回轉換，真的值得高速緩存效率，還是隻有在一個方向進行座標轉換，而不是另一個方向時，它才值得？ – 2012-11-16 00:34:43