3.9 Java內存模型綜述
前面對Java內存模型的基礎知識和內存模型的具體實現進行了說明。下面對Java內存模型的相關知識做一個總結。
3.9.1 處理器的內存模型
順序一致性內存模型是一個理論參考模型,JMM和處理器內存模型在設計時通常會以順序一致性內存模型為參照。在設計時,JMM 和處理器內存模型會對順序一致性模型做一些放松,因為如果完全按照順序一致性模型來實現處理器和JMM,那么很多的處理器和編譯器優化都要被禁止,這對執行性能將會有很大的影響。
根據對不同類型的讀/寫操作組合的執行順序的放松,可以把常見處理器的內存模型劃分為如下幾種類型。
- 放松程序中寫-讀操作的順序,由此產生了Total Store ordering內存模型(稱為TSO)。
- 在上面的基礎上,繼續放松程序中寫-寫操作的順序,由此產生了Partial Store Order內存模型(簡稱為PSO)。
- 在前面兩條的基礎上,繼續放松程序中讀-寫和讀-讀操作的順序,由此產生了Relaxed Memory Order 內存模型(簡稱為 RMO)和 PowerPC 內存模型。
注意,這里處理器對讀/寫操作的放松,是以兩個操作之間不存在數據依賴性為前提的(因為處理器要遵守as-if-serial語義,處理器不會對存在數據依賴性的兩個內存操作做重排序)。
下表展示了常見處理器內存模型的細節特征:
內存模型名稱 | 對應的處理器 | Store-Load重排序 | Store-Store重排序 | Load-Load 和Load-Store重排序 | 可以更早讀取到其他處理器的寫 | 可以更早讀取到當前處理器的寫 |
---|---|---|---|---|---|---|
TSO | sparc-TSO X64 | Y | Y | |||
PSO | sparc-PSO | Y | Y | Y | ||
RMO | ia64 | Y | Y | Y | Y | |
PowerPC | PowerPC | Y | Y | Y | Y | Y |
從上表中可以看到,所有處理器內存模型都允許寫-讀重排序,原因在第1章已經說明過:它們都使用了寫緩存區。寫緩存區可能導致寫-讀操作重排序。同時,我們可以看到這些處理器內存模型都允許更早讀到當前處理器的寫,原因同樣是因為寫緩存區。由于寫緩存區僅對當前處理器可見,這個特性導致當前處理器可以比其他處理器先看到臨時保存在自己寫緩存區中的寫。
上表中的各種處理器內存模型,從上到下,模型由強變弱。越是追求性能的處理器內存模型設計得會越弱。因為這些處理器希望內存模型對它們的束縛越少越好,這樣它們就可以做盡可能多的優化來提高性能。
由于常見的處理器內存模型比JMM要弱,Java編譯器在生成字節碼時,會在執行指令序列的適當位置插人內存屏障來限制處理器的重排序。同時,由于各種處理器內存模型的強弱不同,為了在不同的處理器平臺向程序員展示一個一致的內存模型,JMM 在不同的處理器中需要插人的內存屏障的數量和種類也不相同。下圖展示了JMM 在不同處理器內存模型中需要插入的內存屏障的示意圖。
JMM屏蔽了不同處理器內存模型的差異,它在不同的處理器平臺之上為Java程序員呈現了一個一致的內存模型。
3.9.2 各種內存模型之間的關系
JMM是一個語言級的內存模型,處理器內存模型是硬件級的內存模型,順序一致性內存模型是一個理論參考模型。下面是語言內存模型、處理器內存模型和順序一致性內存模型的強弱對比示意圖,如下圖所示。
從圖中可以看出:常見的4種處理器內存模型比常用的3種語言內存模型要弱,處理器內存模型和語言內存模型都比順序一致性內存模型要弱。同處理器內存模型一樣,越是追求執行性能的語言,內存模型設計得會越弱。
3.9.3 JMM 的內存可見性保證
按程序類型,Java程序的內存可見性保證可以分為下列3類。
- 單線程程序。單線程程序不會出現內存可見性問題。編譯器、runtime和處理器會共同確保單線程程序的執行結果與該程序在順序一致性模型中的執行結果相同。
- 正確同步的多線程程序。正確同步的多線程程序的執行將具有順序一致性(程序的護行結果與該程序在順序一致性內存模型中的執行結果相同)。這是JMM關注的重點,JMM 通過限制編譯器和處理器的重排序來為程序員提供內存可見性保證。
- 末同步/未正確同步的多線程程序。JMM為它們機供了最小安全性保障;線程執行時讀取到的值,要么是之前某個線程寫入的值,要么是默認值(0、null、false)。
注意,最小安全性保障與64位數據的非原子性寫并不矛盾。它們是兩個不同的概念,它們“發生”的時間點也不同。最小安全性保證對象默認初始化之后(設置成員域為0、null或false),才會被任意線程使用。最小安全性“發生”在對象被任意線程使用之前。64位數據的非原子性寫“發生”在對象被多個線程使用的過程中(寫共享變量)。當發生問題時(處理器B看到僅僅被處理器A“寫了一半”的無效值),這里雖然處理器B讀取到一個被寫了一半的無效值,但這個值仍然是處理器A寫入的,只不過是處理器A還沒有寫完而已。最小安全性保證線程讀取到的值,要么是之前某個線程寫入的值,要么是默認值(0、null或false)。但最小安全性并不保證線程讀取到的值,一定是某個線程寫完后的值。最小安全性保證線程讀取到的值不會無中生有的冒出來,但并不保證線程讀取到的值一定是正確的。
下圖展示了這3類程序在JMM中與在順序一致性內存模型中的執行結果的異同。
只要多線程程序是正確同步的,JMM保證該程序在任意的處理器平臺上的執行結果,與該程序在順序一致性內存模型中的執行結果一致。
3.9.4 JSR-133 對日內存模型的修補
JSR-133對JDK5之前的舊內存模型的修補主要有兩個。
- 增強volatile的內存語義。舊內存模型允許volatile 變量與普通變量重排序。JSR-133嚴格限制volatile變量與普通變量的重排序,使volatile的寫-讀和鎖的釋放-獲取具有相同的內存語義。
- 增強final的內存語義。在舊內存模型中,多次讀取同一個final變量的值可能會不相同。為此,JSR-133為final增加了兩個重排序規則。在保證final引用不會從構造函數內逸出的情況下,final具有了初始化安全性。