虛擬地址空間

在早期的計算機中，程序是直接運行在物理內存上的，而直接使用物理內存，通常都會面臨以下幾種問題：

內存缺乏訪問控制，安全性不足
各進程同時訪問物理內存時，可能會產生訪問內存空間重疊的現象，沒有獨立性
物理內存極小，而并發執行進程所需又大，容易導致內存不足
進程所需空間不一，容易導致內存碎片化問題。

基于以上幾種原因，Linux通過 mm_struct 結構體來描述了一個虛擬的，連續的，獨立的地址空間，也就是我們所說的虛擬地址空間。

原理： 當程序被載入內存時，向其呈現出比實際擁有的地址空間大得多的內存——虛擬地址空間，讓程序誤認為自己目前獨占電腦內存，能夠占用電腦所有的內存，訪問所有內存地址，同時建立虛擬地址與物理地址之間的映射。這就允許多個程序可以同時運行且各個程序之間能夠訪問的物理內存區域不重疊，也杜絕了程序直接操作地址的風險，同時也提高物理地址的使用效率。

值得注意的是，在建立了虛擬地址空間后，并沒有立刻分配實際的物理內存，而是當進程需要實際訪問內存資源的時候，才由內核的 請求分頁機制 產生 缺頁中斷 ，這時才會建立虛擬地址和物理地址的映射，調入物理內存頁；如果此時物理內存已經耗盡，則根據內存替換算法淘汰部分頁面至物理磁盤中。通過這種方法，就能夠保證我們的物理內存只在實際使用時才進行分配，避免了內存浪費的問題。

下圖則為Linux下的虛擬地址空間：
在這里插入圖片描述

32位Linux 的地址空間（2³² B = 4 GB）被一分為二：0~3G為用戶空間 ， 3~4G為內核空間。

操作系統和驅動程序運行在內核空間 ，內核模式下，操作系統可以訪問機器的全部資源。
應用程序運行在用戶空間 ，用戶模式下，應用程序不能完全訪問硬件資源。

當進程運行在 內核空間 時，它就處于 內核態 ；當進程運行在 用戶空間 時，它就處于 用戶態 。兩個空間不能簡單地使用指針傳遞數據，因為 Linux 使用了虛擬內存機制，用戶空間的數據可能被換出，當內核空間使用用戶空間指針時，對應的數據可能不在內存中。

用戶空間

用戶空間即進程在用戶態下能夠訪問的虛擬地址空間，每個進程都有自己獨立的用戶空間，大小為 3G 。
在這里插入圖片描述

用戶空間由以下部分組成：

棧：棧用來存放程序中臨時創建的局部變量，如函數的參數、內部變量等。每當一個函數被調用時，就會將參數壓入進程調用棧中，調用結束后返回值也會被放回棧中。同時，每調用一次函數就會在調用棧上維護一個獨立的棧幀，所以在遞歸較深時容易導致棧溢出。棧內存的申請和釋放由 編譯器 自動完成，并且 棧容量由系統預先定義 。棧從高地址向低地址增長。

棧幀從低到上依次是（從高地址到低地址的方向）：

參數
返回地址：將當前代碼區 調用函數指令 的 下一條指令地址 壓入棧中，供函數返回時繼續執行。
ebp（幀指針）：指向當前的棧幀的底部
局部變量
esp（棧指針）：始終指向棧幀的頂部

在這里插入圖片描述

文件映射段： 也叫共享區，文件映射段中主要包括 共享內存、動態鏈接庫 等共享資源，從低地址向高地址增長。

共享資源以動態鏈接庫為例：

動態鏈接庫中的函數都與位置無關，即每次被加載進入內存映射區時的位置都是不一樣的，因此使用的是其本身的邏輯地址，經過變換成線性地址（虛擬地址），然后再映射到內存。
而靜態庫被鏈接到可執行文件中，因此其位于 代碼段 ，每次在地址空間中的位置都是固定的。

堆：堆用來存放動態分配的內存。堆內存由用戶申請分配和釋放，從低地址向高地址增長。不同于數據結構中的堆，存儲空閑內存的方式類似鏈表，因此空閑內存分布不連續。
BSS段： 存放程序中 未初始化 的 全局變量 和 靜態變量 ，全局變量 未初始化 時，其 默認值為0 ，因此也保存 初始化為0的全局變量 。具體體現為一個占位符，并不給該段的數據分配空間，只是記錄數據所需空間的大小。
數據段： 存放程序中 已初始化 的 全局變量 與 靜態變量 。
代碼段： 存放程序執行指令，也可能包含一些只讀的常量（.rodata段）。這塊區域的大小在程序運行時就已經確定，并且為了防止代碼和常量遭到修改，代碼段被設置為只讀。
保留區（受保護的地址）： 大小為128M，位于虛擬地址空間的最低部分，未賦予物理地址。任何對它的引用都是非法的，用于捕捉使用空指針和小整型值指針引用內存的異常情況。它并不是一個單一的內存區域，而是對地址空間中受到操作系統保護而禁止用戶進程訪問的地址區域的總稱。

大多數操作系統中，極小的地址通常都是不允許訪問的，如NULL。C語言將無效指針賦值為0也是出于這種考慮，因為0地址上正常情況下不會存放有效的可訪問數據。

小結堆和棧的區別：
在這里插入圖片描述
由于：

棧沒有內存碎片問題，堆容易造成內存碎片。
堆沒有專門的系統支持，效率很低，
堆可能引發用戶態和內核態切換，內存申請的代價更為昂貴。

所以棧在程序中應用最廣泛，函數調用也利用棧來完成，調用過程中的參數、返回地址、棧基指針和局部變量等都采用棧的方式存放。所以，建議僅在分配大量或大塊內存空間時使用堆。

內核空間

內核空間即進程陷入 內核態 后才能夠訪問的空間。雖然每個進程都具有自己獨立的虛擬地址空間，但是這些虛擬地址空間中的內核空間，其實都關聯的是 同一塊物理內存 ，如下圖：
在這里插入圖片描述
通過這種方法，保證了進程在切換至內核態后能夠快速的訪問內核空間。

內核空間主要分為 直接映射區 和 高端內存映射區 兩部分：

在這里插入圖片描述
直接映射區：

從內核空間起始位置開始，從低地址往高地址增長，最大為 896M 的區域即為直接映射區。

直接映射區的 896M 的 虛擬地址 與 物理地址（ZONE_DMA + ZONE_NORMAL） 的前 896M 進行直接映射，所以虛擬地址和分配的物理地址都是連續的。

那么它們是如何轉換的呢？其實它們之間存在著一個偏移量 PAGE_OFFSET ，偏移量的大小即為 0xC0000000 。

虛擬地址 = PAGE_OFFSET + 物理地址

高端內存映射區:

物理內存中 ZONE_DMA + ZONE_NORMAL 被直接聯系到虛擬內存的 直接映射區 中，那么對于剩下的 896M~4G 大小的 ZONE_HIGHMEM ，尋址工作就交給了高端內存映射區。

由于我們的內核空間只有 1G ，而直接映射區又占據了 896M ，因此我們將剩下的 128M 空間劃分成了三個高端內存的映射區，從上往下分別是：

動態內存映射區： 該區域的特點是虛擬地址連續，但是其對應的物理地址并不一定連續。該區域使用內核函數 vmalloc 進行分配，分配的虛擬地址的物理頁可能會處于低端內存，也可能處于高端內存。
永久內存映射區： 該區域可以訪問高端內存。使用 alloc_page(_GFP_HIGHMEM) 分配高端內存頁，或者使用 kmap 將分配的高端內存映射到該區域。
固定內存映射區： 該區域的每個地址項都服務于特定的用途，如 ACPI_BASE 。