文章目錄
- 1. JVM運行流程
- 2. Java運行時數據區
- 2.1 方法區(內存共享)
- 2.2 堆(內存共享)
- 2.3 Java虛擬機棧(線程私有)
- 2.4 本地方法棧(線程私有)
- 2.5 程序計數器(線程私有)
- 3. JVM 類加載
- 3.1 類加載的過程
- 3.1.1 加載
- 3.1.2 驗證
- 3.1.3 準備
- 3.1.4 解析
- 3.1.5 初始化
- 3.1.6 使用
- 3.1.8卸載
- 3.2 雙親委派模型
- 3.2.1 什么是雙親委派模型
- 3.2.2 破壞雙親委派模型
- 4. 垃圾回收
- 4.1 死亡對象的判斷方法
- 4.1.1 引用計數算法
- 4.1.2 可達性分析算法(JVM使用的算法)
- 4.2 垃圾回收算法
- 4.2.1 標記-清除算法
- 4.2.2 復制算法
- 4.2.3 標記-整理算法
- 4.2.4 分代法
- 4.3 垃圾收集器
- 4.3.1 Serial收集器(新生代收集器,串行GC)
- 4.3.2 ParNew收集器(新生代收集器,并行GC)
- 4.3.3 CMS 收集器(標記-清楚算法)
JVM就是Java虛擬機。虛擬機是指通過軟件虛擬出來的具有完整硬件功能的計算機系統,它的運行環境是完全隔離的。
我們知道Java是一個跨平臺的語言,可以不加修改的在任何操作系統中運行,這就是依托于其運行在JVM中實現的。
1. JVM運行流程
- .java 文件 被編譯成 .class 文件,。
- 通過 類加載子系統 將 .class 二進制字節碼文件加載到內存中。
- 方法區保存類對象,類對象是new對象的模板。
- new出來的對象全都放在堆內存中。
- 每個線程都會在Java虛擬機棧中分配一個與之對應的內存空間,棧中存放是是線程對方法的調用層級。
- 本地方法棧中存放的是本地方法的調用層級。
- 程序計數器,保存的是當前線程執行的行號。
2. Java運行時數據區
2.1 方法區(內存共享)
方法區保存的是類的類對象,這個類對象就是我們在new對象時的模板。由于存放的是類對象,是公共的數據,所以方法區是線程共享的,所以線程都可以訪問這個區域。
在JDK7的實現中被稱為永久代。
在JDK8的實現中被稱為元空間。
2.2 堆(內存共享)
所有new出來的對象都存放在堆中。堆是JVM內存中使用最大的內存區域,默認占內存的八分之一,不過這個比例是可以JVM參數設置進行設置的。
2.3 Java虛擬機棧(線程私有)
每創建一個線程就會在內存中創建一個與之對應的Java虛擬機棧。Java虛擬機棧的生命周期和線程是相同的,線程結束,對應的Java虛擬機棧就會被垃圾回收掉。
在這個Java虛擬機棧中,調用一個方法就會將該方法壓入棧,此時我們將其成為棧幀,當方法執行完之后就會出棧,知道這個棧中的棧幀全部出棧,此時就代表著棧空了,也就意味線程結束了。
2.4 本地方法棧(線程私有)
調用本地方法時使用的棧,記錄本地方法的調用層級。
2.5 程序計數器(線程私有)
我們知道多個線程在CPU上是搶占式執行的。那么線程重新調度到CPU上怎么知道上一次執行到了什么地方呢,就是通過程序計數器來記錄的。
3. JVM 類加載
3.1 類加載的過程
3.1.1 加載
- 通過類的全限定名來獲取定義此類的二進制字節流。
- 將這個字節流所代表的靜態存儲結構轉化為方法區的運行時數據結構。
- 在內存中生成一個代表這個類的java.lang.Class對象,作為方法區這個類的各種數據的訪問入口。
3.1.2 驗證
驗證.class文件是否符合JVM規范。
JVM17規范
3.1.3 準備
比如我們定義了一個常量count。
java public static int count = 100;
在準備階段僅僅是給count分配一個內存空間,并給設置其初始值,就想count,其設置的初始值是0。
3.1.4 解析
將常量池內的符號引用替換為直接引用的過程。也就是把字節碼中的符號引用和真實的內存進行了解析關聯。
3.1.5 初始化
執行代碼中的真正的賦值操作。
3.1.6 使用
使用階段就是new對象的過程,執行構造方法,以及父類的構造方法,初始化完成之后一個對象就創建出來了。
3.1.8卸載
程序停止時從jvm中卸載。
3.2 雙親委派模型
使用哪個類加載器進行加載類的過程。
3.2.1 什么是雙親委派模型
- 當我們創建一個類時,先從應用程序加載器開始向上轉發,一直轉發到啟動類加載器。
- 類啟動加載器在自己的路徑下找,看有沒有要創建的這個類,有則加載,沒有就繼續向下轉發到擴展加載器。
- 擴展加載器在自己的路徑下找,看有沒有要創建的這個類,有則加載,沒有就繼續向下轉發到應用程序加載器。
- 應用程序加載器在自己的路徑中找到類并加載。
3.2.2 破壞雙親委派模型
JDBC就是一個典型的案例。
這段源碼的說明的翻譯:返回此線程的上下文類加載器。該上下文類加載器由線程的創建者提供,供在此線程中運行的代碼在加載類和資源時使用。如果未設置,則默認值為父線程的類加載器上下文。原始線程的上下文類加載器通常設置為用于加載應用程序的類加載器。 返回值:此線程的上下文類加載器,若無則返回 null,表示系統類加載器(若上述情況均不成立,則返回引導類加載器) 異常情況:如果存在安全管理者,并且調用者的類加載器不為空且與上下文類加載器不同或不是其祖先,同時調用者未擁有“getClassLoader”這一運行時權限,則會拋出 SecurityException 異常。
Java平臺里面自身定義了一套API訪問接口,數據庫廠商需要實現這個API,廠商實現了這個接口之后會自己提供的一些jar包,供用戶來使用。
比如我們使用的是MySQL,DriveManager 調用getConnection,getConnection并不知道要使用MySQL,這里就自己指定了自己要用的加載器,使用的是當前線程的上下文問的加載器,此時就破壞了雙親委派模型機制,在加載類時并沒有向上傳遞,而是直接指定了相應的加載器。
4. 垃圾回收
垃圾回收的是對象占用的內存空間,主要說的是堆內存。程序計數器、虛擬機棧、本地方法棧都是和線程同生同死。
4.1 死亡對象的判斷方法
4.1.1 引用計數算法
給每一個對象增加一個引用計數器,每當一個地方引用了該對象時,引用計數器就加一,引用失效時,就減一。當引用計數器為0時,就代表該對象死亡了,是可被回收的。
引用計數法實現較簡單,判斷效率也比較高,但是引用計數法無法解決循環引用的問題 會導致出現內存泄露的情況。
循環依賴的例子:
public class Test {public Object instance = null;private static int _1MB = 1024 * 1024;private byte[] bigSize = new byte[2 * _1MB];public static void testGC() {Test test1 = new Test();Test test2 = new Test();test1.instance = test2;test2.instance = test1;test1 = null;test2 = null;
// 強制jvm進?垃圾回收System.gc();}public static void main(String[] args) {testGC();}
}
JVM并未采用這種方法,但是python使用的是這種算法。
4.1.2 可達性分析算法(JVM使用的算法)
通過以一系列的GC-root的對象作為起始點,從起始點開始向下進行搜索,搜索時走過等我路線,就是引用鏈,當一個對象沒有在任何一個引用鏈上,就表示該對象是不可用的,就會被標記為可回收。那么在下次垃圾回收的時候就會被回收掉。
在Java語言中,可作為GC Roots的對象包含下面幾種:
- 虛擬機棧(棧幀中的本地變量表)中引?的對象;
- 方法區中類靜態屬性引?的對象;
- 方法區中常量引?的對象;
- 本地方法棧中 JNI(Native?法)引?的對象。
4.2 垃圾回收算法
4.2.1 標記-清除算法
- JVM會根據可達性分析算法來標記可回收的內存區域。
- 對標記可回收的內存區域進行回收。
但是標記-清除算法會使內存區域變得很分散 如果此時進來了一個大對象,將會沒有足夠的空間進行存儲,此時就會觸發垃圾回收,如果垃圾回收之后還沒有足夠的空間進行存儲,還會再次進行垃圾回收,一直這樣操作,直到有足夠大的空間能夠存儲這個大對象。
當進行垃圾回收的時候,會停止所有的線程STW,這個停止的時間是沒有辦法控制的,這是非常危險的。
4.2.2 復制算法
這種算法會將內存區域分成兩個部分,我們稱為內存區域一和內存區域二。程序運行的時候只使用一個內存區域,另一個內存區域是空閑的。
- 把內存區域一中存儲的對象,復制到內存區域二中。
- 在內存區域二中把對象按內存地址順序排列好,相當于對內存進行了整理。
- 把內存區域一的空間全部清空。
- 每次回收都重復上述工作。
但是這種算法的內存利用率不高。
4.2.3 標記-整理算法
標記整理算法和復制算法一樣,但是標記整理算法不是將可回收對象進行清理,而是將存活對象向內存的一邊緣移動,然后清除掉邊緣以外的內存區域。
4.2.4 分代法
分代法是將內存分為兩個區域:新生代 和 老年代,這兩個區域的默認比例是1:2。
新生代使用的復制算法,老年代使用的是標記整理算法。
新生代中存放的是剛new出來的對象,老年代中存放的是經過多次GC(默認是15次),也沒有被回收掉的對象。
新生代的內存區域又被分為Eden區和s1區、s2區 這個比例默認是8:1:1。
垃圾回收的過程:
-
所有的新 new的對象都會存放在新生代的Eden區。
-
當Eden區滿了之后,就會觸發一輪GC,如果對象沒有被回收將會被復制到FROM區,然后把Eden區內存全部清空。
-
當觸發下一次GC時,會將FROM區和Eden區仍然存活的對象復制到TO區。
-
接下來就是s1 和 s2進行呼喚from 和 to區,重復上面的步驟。
-
如果經歷了一輪GC對象沒有被回收掉,年齡 +1,如果年齡超過15歲(默認是15 ,但是可以進行設置),年齡保存在對象頭中。
-
如果對象的年齡超過15歲就會被移入老年代。
如果一個很大的對象被創建,Eden區放不下怎么辦??
會嘗試將該對象直接放入老年代。
以上的所有比例都是可以設置的!!!
4.3 垃圾收集器
垃圾收集器是對垃圾回收算法的具體實現。
4.3.1 Serial收集器(新生代收集器,串行GC)
Serial收集器是虛擬機運行在Client模式下的默認新生代收集器。
與其他收集器相比,該收集器簡單而高效(原因:由于是單線程的,沒有線程交互的開銷)。
4.3.2 ParNew收集器(新生代收集器,并行GC)
它是Serial收集器的多線程版本。
ParNew收集器是許多運行在Server模式下的虛擬機中首選的新生代收集器。
4.3.3 CMS 收集器(標記-清楚算法)
CMS(Concurrent Mark Sweep)收集器是?種以獲取最短回收停頓時間為目標的收集器。
CMS的運行過程:
- 初始標記:標記一下GC Roots 能直接關聯到的對象,速度很快,需要STW(為什么?因為保證在標記開始時,引用關系不會發生變化)。
- 并發標記:從“初始標記”的對象開始,并發的便利整個對象圖,標記所有可達對象。整個操作是和用戶線程并發進行的,所以對象的引用關系可能會發生變化。
- 重新標記:會STW,修正并發標記期間,因用戶程序繼續運行而導致標記產生變動的那一部分。
- 并發清除:和用戶進程并發進行,清除掉在標記階段判斷為死亡的對象。