Linux——進程終止/等待/替換

前言

? 本章主要對進程終止，進程等待，進程替換的詳細認識，根據實驗去理解其中的原理，干貨滿滿！

1.進程終止

概念：進程終止就是釋放進程申請的內核數據結構和對應的代碼和數據

進程退出的三種狀態

代碼運行完畢結果正確??
代碼運行完畢結果錯誤
代碼中止異常

我們在學習C語言的時候，寫main函數，一般都會寫return 0；main函數的返回值，通常就代表程序的執行情況，0代表成功，非0代表代碼運行完畢，結果錯誤，不同的值代表不同的錯誤

當父進程創建子進程是為了讓子進程完成某種任務，當子進程結束，肯定要將執行結果返回給父進程，讓父進程知道是什么情況，我們知道子進程結束會保留task_struct，等待父進程獲取結果信息，此時子進程就是僵尸進程，執行結果，也就是返回值就會存放到task_struct中，被父進程獲取

1.1退出碼

進程結束返回的一個狀態通常是一個整數值?

echo $?

打印最近一個進程退出時的退出碼

errno：當庫函數調用失敗或者系統調用失敗他們通常會將一個特定的錯誤代碼賦值給errno

?strerror是C語言的一個庫函數，該函數接收一個errno的錯誤代碼作為參數， strerror負責將這些錯誤代碼轉換為具體的錯誤描述信息，一共有134條

我們可以看到0表示成功? 1表示操作不被允許? 2表示沒有這個目錄或文件 3表示沒有這個進程

相信后面的大家也可以讀懂? 這樣我們就可以根據退出碼知道我們的錯誤是什么了

此時在當前目錄并沒有c.txt文件，ls是C語言寫的一個程序，當執行完程序，發現文件不存在，此時的退出碼是2，不就是上面的2號找不到文件嗎?

1.2進程常見的退出方法

1.2.1從main返回

我們知道main函數是程序的入口，當main函數結束，也return了，進程也就結束了

其他的函數只表示調用函數完成了返回退出碼并不代碼進程結束

1.2.2exit

exit手冊內容? ?exit是直接結束進程，引起進程終止? 它需要一個參數，就是狀態(進程退出碼)

1.2.3_exit?

_exit手冊內容? 用于終止進程的系統調用? 通過實驗我們發現和exit一樣都可以終止進程

?1.2.4exit和_exit區別

補充：我們知道只有OS才可以殺掉進程庫和系統調用是上下層的關系庫調用系統調用

相同點:都可以終止進程

不同點：

exit是標準C庫函數 _exit是系統調用
exit會刷新緩沖區 _exit不會刷新緩沖區

實驗：通過下面的實驗我們也可以驗證exit不會刷新緩沖區

2.進程等待

在理解進程等待前，我們先來想一下進程為什么要進行等待呢？

回收子進程資源(處理僵尸進程)
獲取子進程退出信息

我們知道當子進程退出時，task_struct不會被釋放，需要父進程回收資源，當父進程一直不管時，就可能會造成僵尸進程，可能會出現內存泄露

2.1wait?

手冊內容：wait的參數status是一個輸出型參數在后續的waitpid我們會詳細了解

wait會等待任意一個子進程回收成功會返回回收的pid

接下來我們來使用一下wait?

創建一個子進程讓他跑五次當子進程結束時，讓程序暫停10s，這個時候父進程還沒有回收資源，所以子進程此時就是僵尸進程，根據子進程狀態我們可以看到是Z，父進程回收子進程資源，解決了僵尸進程，返回了子進程的pid，子進程資源被全部釋放，剩余父進程，程序再休眠10s，最后父進程進程也結束

?2.2waitpid

pid_t waitpid(pid_t pid, int *status, int options);? waitpid共有三個參數

接下來會一個一個拆開分析：

?2.2.1pid_t pid

pid_id的值有四種

等待指定pid或者等待任意子進程?

?如果等待失敗會出現什么樣的情況呢？

2.2.2int *status

輸出型參數存儲進程退出時的狀態信息不關心狀態信息設置NULL

我們來進行測試一下：發現出現了一些問題

status不能當做整型看待，可以當做位圖來看待，前16位不考慮，次8位是退出狀態，那么此時應該前7位是0，然后是1，后面還有8個0,因為是2進制，所以應該是2的8次方，也就是256！

當除數為0時就會使程序出現異常

????????其實exit code 和 exit signal都存放在子進程的task_struct中，當子進程是僵尸進程，等待父進程通過操作系統調用回收子進程資源，獲取子進程的退出信息

????????我們在上述的實驗是通過位操作來提取信息的，真正的OS是使用宏，其實就是封裝了一下位操作

WIFEXITED(status): 若為正常終止子進程返回的狀態，則為真。（查看進程是

否是正常退出，程序是否異常，=0為真）

WEXITSTATUS(status): 若WIFEXITED非零，提取子進程退出碼。（查看進程的

退出碼）

2.2.3int options?

補充：

阻塞調用：當一個程序發起操作時，程序會暫停操作，直到這個操作完成并返回結果，在執行操作時，程序不能做任何事，也就是子進程在執行任務時，父進程一直在wait阻塞
非阻塞調用：當一個程序發起操作，不會等操作完成，而是立即返回，執行后續的操作，程序可以定期檢查這個操作是否已經完成，這個操作叫做非阻塞輪詢

我們從手冊里可以看到options是有幾個選項的

默認是0：阻塞調用，如果子進程還沒有退出父進程就會一直阻塞在那里
WNOHANG：非阻塞調用

waitpid的返回值可以是 -1? 0? >0

-1表示失敗

0表示調用結束但是子進程沒有退出

>0 子進程結束

非阻塞輪詢實驗，將waitpid的第三個參數設置為WNOHANG，非阻塞調用，這樣父進程就不會一直等待子進程完成任務，而是立即返回，然后定期去詢問子進程完成任務了嗎？

非阻塞調用實驗：我們可以通過函數指針回調函數來操作

通過實驗我們可以看到在子進程執行任務時，父進程也在執行其他任務

3.進程替換 exec

進程替換就是OS根據指定的程序文件路徑和參數，將新程序的代碼和數據加載到當前進程的地址空間中，覆蓋原來的進程內容，從而實現進程替換

程序替換錯誤返回-1 沒有成功返回值?

當我們知道程序替換會將原先的程序進行覆蓋，我們原先的程序就沒有了，所以我們一般會創建子進程去執行程序替換，這樣父進程的代碼數據也不會丟失了！！?

3.1進程替換的原理

我們先來使用一下execl，我們可以發現第一句printf執行了，然后執行程序替換，然后就沒有輸出了，我們來了解一下程序替換的原理！其實在上面就已近談到了，就是將新程序的代碼和數據加載到當前進程的地址空間中，覆蓋替換原來的進程內容，從而實現進程替換

在程序替換的過程中，并沒有創建新的進程

3.2程序替換接口函數

我們在上面的手冊中可以看到6個接口函數，接下來我們學習四個后續的大家肯定就都懂

還有一個是系統命令 execve? 我們在上面看到的6個接口函數其實都是需要去調用execve

在上層進行封裝為了應對各種各樣的場景最后會統一轉化調用系統調用execve

3.2.1execl

int execl(const char *path, const char *arg, ...);

execl的l可以看做是一個list，第一個參數就是路徑+程序名，第二個參數就是命令，在命令行怎么寫，這里我們就怎么寫，...是可變參數列表的意思，因為我們不知道命令有幾個，最后要以NULL結尾，表明參數已傳完！！

?3.2.2 execlp

int execlp(const char *file, const char *arg, ...);

?execlp的l看做list，p看做PATH，第一個參數就是要執行的文件名，execp會自動在環境變量PATH中查找命令，第二個參數就是命令，同上！

3.2.3execv?

int execv(const char *path, char *const argv[]);

execv的v可以看做是一個vector，第一個參數是要執行的路徑+文件名，第二個參數是一個指針數組，也就是命令行參數表?

3.2.4execvp

int execvp(const char *file, char *const argv[]);

execvp的v可以理解為vector，p理解為PATH，第一個參數就是要執行的文件，第二個是指針數組，就是指命令行參數表，相信大家看到這里一看就看懂了！！

3.2.5??execvpe

int execvpe(const char *file, char *const argv[], char *const envp[]);

execvpe的v可以看做vector，e看做environment，第一個參數就是要執行的文件，第二個就是命令行參數表，第三個也是一個指針數組，是環境變量表，這里的環境變量表會進行覆蓋替換父進程的環境變量表，當然也有方法在原始的環境變量表的基礎上進行添加！！

補充?

putenv 添加環境變量的參數

envrion 訪問當前環境的整個環境列表

解決方案：

不使用需要傳帶env的參數直接進行putenv
使用傳env的參數 putenv? envrion