Cache 總結

這一文,讓我們分析一下,《淺談 Cache》 一文中的奇怪現象,事實上如今來看也并不奇怪了。
? ? ? ? 在什么情況下 r1 和 r2 都為 0 呢?
? ? ? ? 細致看代碼,你會發現,兩個線程分別被執行在不同的 CPU 核上,而且在線程開始的階段還使用了一個隨機數,是為了讓兩個線程能盡量同一時候執行。
? ? ? ? 如果 CPU0 執行:
? ? ? ? x = 1;
? ? ? ? r1 = y;
? ? ? ? CPU1 執行:
? ? ? ? y = 1;
? ? ? ? r2 = x;
? ? ? ? 假設以下的情況發生:
? ? ? ? x 在 CPU1 的 Cache 中。 y 在 CPU0 的 Cache 中。
? ? ? ? 1. CPU0 運行 x = 1, cache miss, 發送 "read invalidate" 消息,并把 x 的值 1 存入 Store Buffer, 開始運行 r1 = y, Cache 命中,r1 為 0;
? ? ? ? 2. CPU1 運行 y = 1,cache miss, 發送 "read invalidate" 消息,并把 y 的值 1 存入 Store Buffer, 開始運行 r2 = x,Cache 命中,r2 為 0;
? ? ? ? 3. CPU0 和 CPU1 各自收到了對方的消息,并作出回應,x 和 y 的值均應用到 Cache 中,且都為 1;
? ? ? ? 主函數收到信號,比較 r1 和 r2 的值,奇跡發生了。
? ? ? ? 假設你知道我講的這些細節,就會發現,事實上這并非奇怪了。那么假設解決問題呢?
? ? ? ? 事實上答案就非常easy了,要么讓兩個線程執行在同一個核心上,要么在兩個語句之間加上內存屏障,經驗證,問題攻克了。
? ? ? ? 題外篇:
? ? ? ? 在不同 CPU 架構下,對內存的亂序訪問事實上是不同的,一般的內存亂序分為下面四種:
? ? ? ? LoadStore, LoadLoad, StoreStore, StoreLoad。而且 X86 下僅僅會出現 StoreLoad 亂序,也就是上面的樣例,我的 CPU 是 X86 的,所以出現了這樣的情況,由此可知,事實上 X86 內存亂序訪問的還不算太厲害。
? ? ? ? 簡單解釋一下,x = 1,為 Store, 讀取 y 的過程為 Load,所以 Load 指令在 X86 下同意在 Store 還未更新到 Cache 中之前被運行。
? ? ? ? 走出一個誤區,內存亂序訪問與 CPU 亂序運行(Out of Order,即 OOO)不同。
早期的處理器為有序處理器(In-order processors),有序處理器處理指令通常有下面幾步:
? ? ? ? 1. 指令獲取

? ? ? ? 2. 假設指令的輸入操作對象(input operands)可用(比如已經在寄存器中了),則將此指令分發到適當的功能單元中。假設一個或者多個操作對象不可用(一般是因為須要從內存中獲取),則處理器會等待直到它們可用;

? ? ? ? 3. 指令被適當的功能單元運行

? ? ? ? 4. 功能單元將結果寫回寄存器堆(Register file,一個 CPU 中的一組寄存器)
?
? ? ? ? 相比之下,亂序處理器(Out-of-order processors)處理指令通常有下面幾步:
? ? ? ? 1. 指令獲取
? ? ? ? 2. 指令被分發到指令隊列
? ? ? ? 3. 指令在指令隊列中等待,直到輸入操作對象可用(一旦輸入操作對象可用,指令就能夠離開隊列,即便更早的指令未被運行)
? ? ? ? 4. 指令被分配到適當的功能單元并運行
? ? ? ? 5. 運行結果被放入隊列(而不馬上寫入寄存器堆)
? ? ? ? 僅僅有全部更早請求運行的指令的運行結果被寫入寄存器堆后,指令運行的結果才被寫入寄存器堆(運行結果重排序,讓運行看起來是有序的)
? ? ? ? 從上面的運行過程能夠看出,亂序運行相比有序運行能夠避免等待不可用的操作對象(有序運行的第二步)從而提高了效率。現代的機器上,處理器運行的速度比內存快非常多,有序處理器花在等待可用數據的時間里已經能夠處理大量指令了。
? ? ? ? 如今思考一下亂序處理器處理指令的過程,我們能得到幾個結論:
? ? ? ? 對于單個 CPU 指令獲取是有序的(通過隊列實現)
? ? ? ? 對于單個 CPU 指令運行結果也是有序返回寄存器堆的(通過隊列實現)
? ? ? ? 由此可知,在單 CPU 上,不考慮編譯器優化導致亂序的前提下,多線程運行不存在內存亂序訪問的問題
? ? ? ? CPU 盡管是亂序運行,可是是順序流出結果,在我們看來,亂序運行對我們來講是透明的,我們看到的結果和指令順序是一樣的。

轉載于:https://www.cnblogs.com/gcczhongduan/p/4065365.html

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/376544.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/376544.shtml
英文地址,請注明出處:http://en.pswp.cn/news/376544.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

c/c++常見類型轉換錯誤

文章目錄char轉int 高位符號擴展有符號int與無符號int比較關于一個bit的位域變量的取值范圍臨時變量溢出size_t死循環char轉int 高位符號擴展 int main() {char a 0x9A;int util;util (int)a;cout << a << endl;cout << util << endl;if (util >…

Javascript 裝載和執行

一兩個月前在淘寶內網里看到一個優化Javascript代碼的競賽&#xff0c;發現有不少的人對Javascript的執行和裝載的基礎并不懂&#xff0c;所以&#xff0c;從那天起我就想寫一篇文章&#xff0c;但一直耽擱了。 首先&#xff0c;我想說一下Javascript的裝載和執行。通常來說&am…

java sundry tips

1.關于Arrays 記得binarySearch方法返回的int 類型的數值的含義。 If the array contains multiple elements with the specified value, there is no guarantee which one will be found. 而且當查找數小于數組中任何一個數時返回-1 &#xff0c;當查找數大于數組中任何…

c++常見的10個類對象問題

文章目錄1、對象的淺復制2、構造函數中的操作符重載3、拷貝構造函數不能模板化4、析構函數未捕獲異常導致coredump5、構造函數拋出異常6、基類析構函數非虛導致內存泄漏7、刪除void*指針引發內存泄露8、成員函數尾部缺失const9、使用memset初始化class10、對象向下轉換失敗1、對…

Ubuntu 14.10 -- 異次元軟件世界

Ubuntu 14.10 中文桌面版/服務器正式版下載 - 華麗免費易于入門的 Linux 操作系統 [ 系統工具 - Linux // 2014-10-25 ]一說到 Linux&#xff0c;就不得不提目前最紅火的 Ubuntu 發行版了&#xff01;它擁有絢麗的界面&#xff0c;甚至跟以時尚為賣點的 Mac OSX 相比也有過之而…

maven 概念

這里maven倡導約定優于配置&#xff0c;maven的約定就是以下目錄結構src/main/java 下存放java類src/main/webapp 下存放頁面文件(需要手動創建)src/main/resources 下存放資源文件src/test/java 下存放單元測試代碼src/test/resources 下存放測試資源文件 Maven運行的生命周期…

System Design筆記:在線售票系統設計

文章目錄何為在線售票系統&#xff1f;系統目標和要求1、功能要求2、非功能性需求3、設計注意事項4、容量估算5、系統API1.SearchMovies2.ReserveSeats6、數據庫設計7、高級設計8、細節模塊設計9、流程服務器如何跟蹤所有尚未預訂的active預訂&#xff1f;服務器如何跟蹤所有等…

Response.Write具體介紹

問題一&#xff1a; Response.Write 后連接Response.Redirect &#xff0c;則Response.Write無法顯示&#xff0c;直接跳轉入Response.Redirect 的頁面。 解決方案&#xff1a; Response.Write("<script langugejavascript>alert(成功改動); window.location.hrefin…

SharePoint通過IP地址訪問

問題&#xff1a;SP站點通過計算機名稱可以訪問&#xff0c;但不能通過IP地址訪問 解決方案&#xff1a;打開SharePoint2010管理中心》應用程序管理》配置備用訪問映射》編輯公用 URL 備用訪問映射集&#xff1a;選擇要映射的網站集 默認:http://計算機名 Intranet &#xff1a…

公有云與私有云的差別(轉)

公有云與私有云的差別 發現每一個公司對私有云、公有云的定義都不一樣&#xff0c;能夠從公有云與私有云的差別上理解這個概念。下面轉載網絡上一個比較淺顯的解釋&#xff1a; 差別1&#xff1a;從云的建設地點劃分&#xff0c;公有云——互聯網上公布的云計算服務&#xff1b…

流媒體協議初探(MPEG2-TS、RTSP、RTP、RTCP、SDP、RTMP、HLS、HDS、HSS、MPEG-DASH)

目錄一、綜述需求分析協議定制二、MPEG2-TS協議三、RTSP協議、RTP、RTCP、SDPRTSPRTP、RTCP、SDP四、RTMP五、HLS、HDS、HSSHLSHDS和HSS六、MPEG-DASH協議具體內容應用七、流媒體服務器流媒體服務器的功能與挑戰客戶端支持協議支持應用場景應用特點擴展技術廣告投放錄屏其他一、…

eclipse偶爾會反映遲鈍,直接無視其報錯

比如&#xff0c;你在web.xml中配置了什么東西&#xff0c;在有的時候不一定就會立即被eclipse察覺到&#xff0c;即便你的配置正確了&#xff0c;甚至重啟了幾次服務器&#xff0c;它仍然給你報錯 比如說&#xff0c;剛才我在web.xml中配置了一個taglib&#xff0c;并且tld文件…

Qos(Quality of Service)

QOS&#xff08;即Quality of Service&#xff0c;服務質量&#xff09;主要指網絡環境下服務滿足用戶的程度&#xff0c;在視頻服務的語境下也可認為是Quality of Streaming&#xff0c;即流媒體服務的質量。通常&#xff0c;QOS可以由一系列指標表達&#xff0c;如傳輸的速度…

Popline:帥氣的浮動 HTML5 文本編輯器工具欄

Popline 是一個基于 HTML5 實現的富文本編輯器工具欄&#xff0c;設計靈感來自 PopClip &#xff0c;相比傳統的文本編輯器工具&#xff0c;Popline 能夠浮動在編輯的文本周圍&#xff0c;操作起來十分方便。 您可能感興趣的相關文章Metronic – 基于 Bootstrap 響應式后臺管理…

C#反射Assembly 具體說明

1、對C#反射機制的理解 2、概念理解后&#xff0c;必須找到方法去完畢&#xff0c;給出管理的主要語法 3、終于給出有用的樣例&#xff0c;反射出來dll中的方法 反射是一個程序集發現及執行的過程&#xff0c;通過反射能夠得到*.exe或*.dll等程序集內部的信息。使用反射能夠看到…

流媒體技術優化

文章目錄1、下載策略優化CDN選擇策略錯誤處理策略碼率選擇策略2、協議和架構優化HTTP2TCP變種擁塞控制QUIC架構流媒體協議的選擇與分發體系架構的設計對優化起著關鍵作用。 HLS和DASH協議在點播和OTT直播服務中已逐漸占據主流&#xff0c;其思想主要是將視頻轉為不同碼率并切為…

Android——android必看 各個控件屬性(網上看到的文字,覺得挺好的,珍藏了)...

屬性 值 說明 Android:orientation horizontal/vertical 設置布局水平還是垂直&#xff0c;默認是垂直 android:checked true/false 標記默認選中&#xff0c;如果是單選則選中最后一個 android:layout_gravity center/right/left/bottom/top 位置 android:gravity…

java中接口的定義與實現

1、定義接口 使用interface來定義一個接口。接口定義同類的定義類似&#xff0c;也是分為接口的聲明和接口體&#xff0c;當中接口體由常量定義和方法定義兩部分組成。定義接口的基本格式例如以下&#xff1a; [修飾符] interface 接口名 [extends 父接口名列表]{ [public] …

API設計筆記:pimpl技巧

pimpl pointer to implementation&#xff1a;指向實現的指針&#xff0c;使用該技巧可以避免在頭文件暴露私有細節&#xff0c;可以促進API接口和實現保持完全分離。 Pimpl可以將類的數據成員定義為指向某個已經聲明過的類型的指針&#xff0c;這里的類型僅僅作為名字引入&am…

C++必讀書

C必讀書 《Inside The C Object Model》 《Effective C》和《More Effective C》以及《Exceptional C》 《C面向對象高效編程(C Effective Object-Oriented Software Construction)》 《面向對象軟件構造(Object-Oriented Software Construction)》 《設計模式(Design Patterns…