內存碎片通常分為內部碎片和外部碎片:
? 1. 內部碎片是由于采用固定大小的內存分區,當一個進程不能完全使用分給它的固定內存區域時就產生了內部碎片,通常內部碎片難以完全避免;
? 2. 外部碎片是由于某些未分配的連續內存區域太小,以至于不能滿足任意進程的內存分配請求,從而不能被進程利用的內存區域。
? 現在普遍采用的段頁式內存分配方式就是將進程的內存區域分為不同的段,然后將每一段由多個固定大小的頁組成。通過頁表機制,使段內的頁可以不必連續處于同一內存區域,從而減少了外部碎片,然而同一頁內仍然可能存在少量的內部碎片,只是一頁的內存空間本就較小,從而使可能存在的內部碎片也較少。
解決辦法:
當程序申請一個長度為3的內存空間后:
當程序再申請一個長度為2,以及長度為4的內存空間后:
此時,只剩1個可用空間。如果這時程序再來申請長度大于1的空間,就申請不了,也就是內存不夠。
現在,釋放掉ID=2的空間:我們發現,現在可用內存空間為3,但是,這3個空閑空間,并不是連續的。所以,如果程序現在申請長度為3的內存空間,同樣會申請不了,會出現內存不夠。業界把這種情況,稱之為【內存碎片】。
明明剩余有3個空間,卻申請不了3個內存空間,這TMD扯蛋?
于是,工程師們,發明了基于頁面的內存管理方式:
首先,把物理內存,按照某種尺寸,進行平均分割。比如我現在以2個內存單位,來分割內存,也就是每兩個連續的內存空間,組成一個內存頁:
接著,系統同樣需要維護一個內存信息表:
現在,程序申請長度為3的內存空間,不過由于現在申請的最小單位為頁面,而一個頁面的長度為2,因此現在需要申請2個頁面,也就是4個內存空間。你看,這就浪費了1個內存空間。
接著,程序再申請長度為1,長度為2的空間:
釋放掉ID=2,內存頁ID為3的那條內存空間信息:
現在,就出現了之前的情況:目前一共有4個內存空間,但是不連續。不過,因為現在是分頁管理機制,因此,現在仍然可以繼續申請長度為4的內存空間:
這種方案是不是爽得多?沒有碎片,能夠盡量地全部用完空間。但仔細想想,這種優勢背后,也是需要付出大量代價的。
前面那種內存分配方式,雖然容易出現碎片,并且內存空間的利用率低,但是使用性能高,程序能直接從內存信息表獲取內存地址,接著就可以直接按照地址來使用內存空間了。
但下面這種分頁的方式,程序需要記錄的是內存頁ID,每次使用時,需要從內存頁ID翻譯成實際內存地址,多了一次轉換。而且這種模式,會浪費一些內存,比如上面申請3個內存空間,實際分配了2個頁面共4個內存空間,浪費了1個內存空間。
以上就是基本原理,實際系統中會做非常多的優化。目前各種主流操作系統都是分頁的方式,因此你不需要太關心碎片。
這個話題再延伸下去,就是一個程序內部的局部內存池了。不過這是另一個問題,喜歡的話可以深究一下。