進程和程序

一個程序可以創建多個進程，每個進程的文本段相同，但是數據段、堆、堆棧段卻不同。

進程的特性：

程序最初以某種可執行格式駐留在外存上（如：磁盤）。操作系統運行程序時將需要用到的代碼和所有靜態數據加載（load）到內存中(惰性執行，暫時用不到的代碼不加載)，方便 CPU 運行進程時使用。
在這里插入圖片描述

操作系統如何控制和調度程序

實際中，一個正常的系統可能會有上百個進程同時在運行，而我們只有少量的物理 CPU 可以使用，因此，如何滿足諸多進程對于 CPU 的需求便成了重中之重。

按照馮諾依曼體系結構，所有的數據想要被CPU進行處理，第一步就是要將代碼和數據加載到內存中。
在這里插入圖片描述

操作系統通過 虛擬化CPU ，讓一個進程只運行一個時間片，然后切換到其他進程，通過 快速切換 和 優先級調度 運行所有的程序，造成了同時運行的假象。這就是 時分共享CPU技術 ，也就是 CPU分時機制 。

但是，這里還存在著幾個問題，CPU是如何在內存中找到每個程序的？CPU在來回調度時，如何能夠從上一次運行的位置繼續運行？如何能夠保證繼續處理上一條沒有處理完的數據？

操作系統為了能夠完成上述操作，設置了一個用于描述進程信息的數據結構—— PCB 。

操作系統為了能夠使每個程序能夠獨立運行，在操作系統中為其配置了一個數據結構，也就是我們通常所說的 PCB（Process Control Block），這個數據結構在 Linux下是：task_struct

task_struct 中的內容：

在這里插入圖片描述

PCB有兩種組織方式：

鏈接方式：
在這里插入圖片描述
索引方式：

PCB是操作系統對一個運行中的程序(也就是進程)的描述，操作系統通過這個描述來實現對程序的運行調度：

在這里插入圖片描述

回到前面提出的問題：

我們可以通過 fork 在一個 已經創建的進程內 創建一個 新的進程 ，這個 新的進程 就是 原先進程的子進程 。

在子進程創建的時候，它從父進程的PCB中復制了很多數據，如內存指針、上下文數據、程序計數器等，所以它的代碼、數據以及運行的位置，都與父進程一模一樣。

由于代碼段是只讀的，所以兩者的代碼都一樣，不可修改，而兩者雖然虛擬地址相同，但物理地址不同，所以兩者的數據都各自獨立。

總結一下就是：父子進程代碼共享，數據各自開辟空間。 (利用寫時拷貝技術)

在 Linux 中，我們可以通過 fork 函數 來創建子進程

pid_t fork(void)

我們創建子進程，是希望它和父進程執行不一樣的操作，那么我們該怎么實現呢？

最簡單的方法就是通過 fork 的返回值來進行代碼分流，父進程的返回值是子進程的 pid ，而子進程的返回值是 0 ，通過對返回值的判斷，即可完成代碼的分流。

但是這種方法的代碼十分冗余，還有一種更加優秀的方法——程序替換。

進程有三種基本狀態：
在這里插入圖片描述

執行狀態（running）：
1. 進程正在 CPU上執行；
2. 只能有一個進程處于執行狀態（單CPU）；
就緒狀態（ready）：
1. 進程已獲得除 CPU 外的所有資源，等待分配 CPU 就可執行；
2. 可以有多個進程處于就緒狀態，組成就緒隊列。
阻塞狀態（waiting）：
1. 進程因自身原因（如：等待I/O資源）而暫停執行，也稱 “等待狀態” 或 “睡眠狀態” 。
2. 可以有多個進程處于阻塞狀態，組成阻塞隊列

但是在 Linux 中，將狀態細分到了六種：

R運行狀態（running）： 并不意味著進程一定在運行中，它表明進程要么是在運行中要么在運行隊列里。
S睡眠狀態（sleeping)： 意味著進程在等待事件完成（這里的睡眠有時候也叫做可中斷睡眠（interruptible sleep）。
**D磁盤休眠狀態（Disk sleep）：**有時候也叫不可中斷睡眠狀（uninterruptible sleep），在這個狀態的進程通常會等待 IO 的結束。
T停止狀態（stopped）： 可以通過發送 SIGSTOP 信號給進程來停（T）進程。這個被暫停的進程可以通過發送 SIGCONT 信號讓進程繼續運行。
X死亡狀態（dead）： 這個狀態只是一個返回狀態，你不會在任務列表里看到這個狀態
Z僵死狀態（Zombies）： 進程已經退出了但是資源還沒有完全被釋放的一種狀態。