1.JVM是什么?
1.1 JVM概念
Java Virtual Machine (JVM) 是JDK的核心組件之一,它使得 Java 程序能夠在任何支持 JVM 的設備或操作系統上運行,而無需修改源代碼
JDK是什么,JDK和JVM是什么關系?
1.Java IDE(Integrated Development Environment):集成開發環境,專門用于Java編程(例如IDEA),開發Java應用程序前需要選擇某具體版本的JDK
2.JDK(Java Development Kit)
Java開發工具包,用于編寫,編譯,調試和運行Java應用程序,提供了開發Java程序所需的所有工具和資源。JDK=JRE+其他
3.JRE(Java Runtime Environment)
Java運行時環境,包含Java虛擬機(JVM),類庫和其他文件,用于運行Java程序
通過以上的內容梳理可知,JDK包含JRE,JRE包含JVM
1.2 JVM作用
說到這里,我就要搞清楚計算機是如何認識我們編寫的代碼的
首先,計算機只認識0和1,執行的指令集也是一串一串的01。所以,我們編寫的代碼一定是被轉換為二進制文件才能被計算機執行。
其次,不同的操作系統的指令集是不同的。例如,在Windows系統中0000 0010的意思是加法,而在Linux系統中的意思是減法(只是舉例,不是真正的指令集)。
那么將開發者編寫的代碼直接轉換為二進制文件,放在不同的操作系統中運行的結果可能也不同,如果要實現同樣的功能就需要在不同的操作系統上編寫不同的代碼。
Java能跨平臺運行的原因
先回憶一下剛開始學習Java編程的時候聽過的一句話"一次編譯,到處運行",這句話體現了Java的跨平臺能力,開發者只需要編寫一次Java代碼并編譯成字節碼文件,就可以在任何安裝了JVM的機器上執行。
下面是Java代碼從編寫到運行的過程
java文件通過javac(Java編譯器,Java Compiler)編譯成字節碼文件(class文件)
可以把JVM看成計算機,字節碼文件就相當于JVM的指令集。然后JVM把字節碼文件轉換為對應系統的指令集,
例如:現在有"Hello World"這么一串代碼,Windows系統上的JVM將代碼轉換為0010,Linux系統上的JVM將代碼轉換為0110,最后兩個系統的執行結果都是"Hello World",這就實現了Java程序的跨平臺運行
1.3 JVM執行流程
程序在執行之前先要把java代碼轉換成字節碼(class文件),JVM 首先需要把字節碼通過一定的方式類加載器(ClassLoader) 把文件加載到內存中運行時數據區(Runtime Data Area) ,而字節碼文件是 JVM 的一套指令集規范,并不能直接交個底層操作系統去執行,因此需要特定的命令解析器執行引擎(Execution Engine)將字節碼翻譯成底層系統指令再交由CPU去執行,而這個過程中需要調用其他語言的接口本地庫接口(Native Interface) 來實現整個程序的功能
2.深入學習JVM
2.1運行時數據區
運行時數據區是Java程序執行時所需的內存區域。JVM啟動時,會根據不同的內存區域分配和管理內存。一般來說,線程共享的區域的生命周期和JVM一致;線程私有的區域會隨著線程的創建和銷毀跟著一起創建和銷毀,生命周期和所屬線程一致。
2.1.1.方法區(線程共享)
方法區是JVM內存規范中定義的抽象概念,并不是真實的物理空間。
在JDK8以前,使用永久代來實現方法區。永久代是在堆中開辟的內存空間,主要存儲:
(1)類的元信息:類名,修飾符等
(2)常量池
(3)靜態變量
注:永久代的大小是在JVM啟動時固定的,難以根據實際需求來動態調整,而且永久代是在堆內存中開辟的空間,這也限制了永久代的大小。所以在JDK8之后使用元空間來實現方法區
在JDK8及以后,使用元空間來實現方法區(上面圖片中的元數據區/元空間不太準確,但我確實沒有找到更好的圖片)
元空間存儲方式相較于永久代有所改動。首先,元空間不再在堆內存中開辟空間,而是單獨向操作系統申請空間,這就不會再受到堆內存大小的限制。其次,元空間可以根據實際需求來動態調整大小。然后,元空間內部存儲的數據也發生了一些變化
(1)類的元信息依舊存儲在元空間中
(2)常量池轉移到堆中
(3)靜態變量
2.1.2.堆(線程共享)
JVM內存中最大的部分,是所有線程共享的空間。
1.在JVM啟動時創建(可以動態調整大小,有上限),是垃圾回收的主要位置。
2.幾乎所有的對象實例(通過new創建)都存儲在堆中。
3.從內存回收角度來看java堆可分為:新生代和老生代
注:JVM在編譯時會分析對象是否逃逸出方法或者線程,如果對象不會逃逸出方法或者線程,只在內部使用,JVM就可以將其分配在棧(線程私有)上,以提高性能減少垃圾回收的開銷,這里不做詳細討論
2.1.3.虛擬機棧(線程私有)
每個線程都有一個獨立的虛擬機棧,用于存儲棧幀(Stack Frame)。每個方法在執行時都會創建一個棧幀,用于存儲方法的局部變量,方法調用和返回地址
2.1.4.本地方法棧(線程私有)
存儲本地方法(Native Methods)調用的信息。本地方法是使用非Java語言(如C、C++)編寫的方法,它們通過JNI(Java Native Interface,Java本地方法接口)與Java代碼進行交互
2.1.5.程序計數器(線程私有)
存儲當前線程執行的字節碼指令的地址
2.2類加載器
2.2.1類加載過程
類加載包括:加載(Loading),連接(Linking)和初始化(Initialization)三個步驟
(1)加載(Loading)
通過類加載器將硬盤中的字節碼文件加載到運行時數據區,并生成一個類對象存儲在方法區。當然,也不一定是硬盤中的字節碼文件,還可能來自于網絡、數據庫,甚至是即時生成的字節碼文件
注意一:著重區分加載和類加載的區別。加載(Loading)只是類加載的第一個階段;而類加載包括加載(Loading),連接(Linking)和初始化(Initialization)三個步驟
(2)驗證(Verification)
確保類文件符合JVM規范中定義的類文件格式。
文件格式驗證:檢查文件是否是以0xCAFEBABE開頭,這是Java類文件的標識;檢查類文件的版本號是否和JVM對應,Java 8的JVM不支持Java 9的類文件
元數據驗證:確保類的元數據信息沒有語法錯誤
字節碼驗證:確保類的字節碼指令是合法的,不會導致JVM崩潰或者執行不安全操作
注意二:在今天,驗證操作不單單是驗證(Verification)這一個階段了。在解析階段還有符號引用驗證,解析階段可以發生在初始化之前,也可能發生在初始化之后(代碼中發生多態來實現后期綁定),而且JVM的開發人員還在不斷完善驗證策略,所以驗證操作分散在各個階段內,并不是單一的階段。
(3)準備(Preparation)
為類的靜態變量分配內存并設置默認值。
-
將類的靜態變量分配到方法區(有一些靜態變量不在方法區)
-
基本數據類型初始化默認值,int類型初始化為0,boolean類型初始化為false
-
引用類型初始化為null
-
如果是靜態常量,直接賦目標值,跳過默認值
(4)解析(Resolution)
將符號引用替換為直接引用。
直接引用:指向內存中的實際地址的指針或者偏移量
符號引用:是一種文本形式的引用,使用字符串或其他符號來描述目標類,字段和方法
問題:為什么要引入符號引用?
因為在class文件加載到運行時數據區之前,class文件是在硬盤或者其他空間中存儲的(反正不是內存),沒有地址和指針這個概念,如果要定位一個類,只能使用其他形式的標識符
動態解析舉例:加入B類是一個抽象類,實現的是身份選擇功能,C和D類繼承了B,分別代表普通用戶和管理員。那么A到底引用C還是D,這可能需要用戶來決定。此時,A類就會先進行初始化階段,當用戶選擇完身份后再來解析
(5)初始化(Initialization)
任務:執行類的初始化代碼
觸發條件(以下任一情況都會觸發初始化):
1.創建類的實例(new
)
2.訪問類的靜態變量(非final
)或靜態方法
3.反射調用類(Class.forName("com.example.MyClass")
4.子類初始化時,其父類會先被初始化
5. 作為程序入口的主類(包含main()
方法的類)
執行順序:
1.父類靜態變量和靜態代碼塊(按代碼順序執行)
2.子類靜態變量和靜態代碼塊(按代碼順序執行)
3.父類實例變量和構造代碼塊
4.父類構造函數
5.子類實例變量和構造代碼塊
6.子類構造函數
2.2.2類加載器
在上述類加載過程中,第一個階段"加載"涉及到JVM中一個非常重要的模塊——類加載器。類加載器主要負責根據類的全限定名找到對應的.class文件
什么是全限定名?
全限定名指的是包含**包名**在內的**類**的完整名稱。例如,假設有一個ArrayList類,屬于java.util包,那么它的全限定名就是java.util.ArrayList
類加載器的搜索范圍:不同的類加載器負責不同路徑的類加載。在JVM中,不算自定義的類加載器,默認的類加載器有三種:
(1) 啟動/引導類加載器(Bootstrap ClassLoader):加載 `JAVA_HOME/lib` 下的核心類庫
(如 `rt.jar`)
注:這里的JAVA_HOME一般指的是JDK的安裝路徑,如下圖
rt.jar(以JDK8為例):包含Java標準庫,如java.lang,java.util等,至于標準庫有哪些在Java語言規范中有明確規定,這里不過多贅述。這些標準庫中的類由啟動/引導類加載器負責加載。
(2) 擴展類加載器(Extension ClassLoader):加載 `JAVA_HOME/lib/ext` 下的擴展類
Java語言規范中沒有的類,并且是由JVM開發者添加的類,稱為擴展類,這些類由擴展類加載器負責加載。JVM的版本有很多,所以擴展類有哪些和JVM的具體版本有關
(3) 應用類加載器(Application ClassLoader):加載用戶類路徑(ClassPath)下的類
一般包括開發者編寫的類和第三方依賴庫
2.2.3 雙親委派機制(不考慮自定義類加載器)
核心思想:當類加載器收到類加載請求時,不會自行立即加載,而是先將該加載請求委派給父類加載器,最終請求會到達頂層類加載器。
完整過程:
(1)頂層加載器(啟動類加載器,Bootstrap ClassLoader)檢查JAVA_HOME/lib路徑下的核心類庫,如果能找到就加載
(2)如果啟動類加載器找不到,請求返回給擴展類加載器,檢查JAVA_HOME/lib/ext路徑下的擴展類,如果能找到就加載
(3)如果擴展類加載器找不到,請求返回給應用類加載器,檢查用戶類路徑下的類
(4)如果所有類加載器均無法加載請求類,則拋出ClassNotFoundException
雙親委派機制的優勢:
1. 避免核心類被篡改
安全性:通過優先由啟動類加載器加載核心類(如 java.lang.String
),確保用戶無法定義同名類覆蓋核心類
示例:若用戶自定義 java.lang.String
,JVM 會直接加載核心庫中的版本,用戶類被忽略
2.防止重復加載
唯一性:每個類由父類優先加載,確保同一個類在多個類加載器中只加載一次
示例:若父類已加載 com.example.MyClass
,子類不會再重復加載,避免內存浪費和類沖突
3.天然的類隔離性
隔離性:不同類加載器加載的類屬于不同的命名空間,天然隔離。
4.靈活擴展
可定制性:允許子類加載器擴展加載范圍(如從網絡、數據庫加載類),同時不破壞核心類的穩定性
3.小結
下篇博文將繼續介紹JVM剩下核心機制——垃圾回收