緩存未命中

緩存未命中（Cache Miss）發生在 CPU 訪問某塊內存時，該地址不在當前緩存（L1/L2/L3）中，導致程序被迫從更慢的內存（RAM）讀取數據，嚴重拖慢程序執行速度。

📍 一、什么時候會發生緩存未命中？
常見原因包括：
場景說明
? 數據訪問不連續比如訪問數組跳著取（a[i*10]）導致預取失敗
? 頻繁訪問大量數據比如一個 10GB 數組，超出緩存容量（一般幾十KB ~ MB）
? 使用指針結構（如鏈表）遍歷每個節點不連續，CPU 無法預取
? 跨線程競爭同一緩存行（稱為 false sharing）多線程操作挨得太近的數據
? 數據結構嵌套復雜多層嵌套對象，內存分布分散
? 隨機訪問容器（如 unordered_map）哈希表節點可能分散，跳來跳去訪問內存

? 示例：跳躍訪問數組（壞的局部性）
? 示例：鏈表遍歷

如何減少

? 1. 連續內存訪問（改善局部性）
? 2. 結構體內存對齊優化
? 3. 數組替代鏈表
? 4. 減少內存分配碎片
? 5. 利用預取機制（CPU會自動做，但你可幫它）
? 6. 結構體壓縮布局（小對象數組壓縮）
? 7. 多線程注意緩存行對齊
? 避免 false sharing

結構體壓縮布局的思想：

不要這樣：
std::vector<std::unique_ptr<Node>> nodes;
會導致數據四分五裂，緩存命中率差。應該這樣：struct Node { int x, y; };
std::vector<Node> nodes;// 所有數據連續，命中率高！? 簡單解釋：這個建議的核心是 數據布局 與 緩存命中率 的關系。🧠 你代碼是干嘛的？
不推薦的寫法：
std::vector<std::unique_ptr<Node>> nodes;你創建了一個 vector 容器，里面放的是 指向 Node 的智能指針。每個 Node 是單獨在堆上分配的內存（用 new 出來的）。所以，內存長這樣：[nodes vector] ---> [ptr1] --> [Node1 在堆上][ptr2] --> [Node2 在堆上][ptr3] --> [Node3 在堆上]這些 Node 是分散在內存中的。如果你遍歷 nodes，訪問每個 Node，由于它們位置不連續，CPU 緩存命中率差，性能低。推薦的寫法：
struct Node { int x, y; };
std::vector<Node> nodes;你創建了一個 vector<Node>。每個 Node 是直接在 vector 的內部內存塊中分配的，是 連續排列的！內存結構大概是這樣的：[nodes vector 內存] --> [Node1][Node2][Node3]（連續）當你遍歷這個 vector 的時候，CPU 能一次性加載多個 Node 進緩存，命中率高，性能好。📌 總結：為啥推薦第二種寫法？
項目	vector<unique_ptr<Node>>	vector<Node>
內存布局	分散在堆上	連續在內存中
CPU 緩存命中率	差	高
遍歷性能	差	高
適用場景	Node 很大或多態（虛函數）時才需要	Node 很小且無繼承時最好用這個
?? 補充說明：如果 Node 是一個 抽象基類或有復雜資源管理（如虛函數、繼承、變長數據） 的結構，那你可能不得不用 unique_ptr<Node>。但如果 Node 是個簡單的數據結構，比如 int x, y; 這種，就盡量用 值類型（vector<Node>），性能會更好。

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/bicheng/96600.shtml
繁體地址，請注明出處：http://hk.pswp.cn/bicheng/96600.shtml
英文地址，請注明出處：http://en.pswp.cn/bicheng/96600.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！