前言
? 本章主要對進程終止,進程等待,進程替換的詳細認識,根據實驗去理解其中的原理,干貨滿滿!
1.進程終止
概念:進程終止就是釋放進程申請的內核數據結構和對應的代碼和數據
進程退出的三種狀態
- 代碼運行完畢 結果正確??
- 代碼運行完畢 結果錯誤
- 代碼中止異常
我們在學習C語言的時候,寫main函數,一般都會寫return 0;main函數的返回值,通常就代表程序的執行情況,0代表成功,非0代表代碼運行完畢,結果錯誤,不同的值代表不同的錯誤
當父進程創建子進程是為了讓子進程完成某種任務,當子進程結束,肯定要將執行結果返回給父進程,讓父進程知道是什么情況,我們知道子進程結束會保留task_struct,等待父進程獲取結果信息,此時子進程就是僵尸進程,執行結果,也就是返回值就會存放到task_struct中,被父進程獲取
1.1退出碼
進程結束返回的一個狀態 通常是一個整數值?
echo $?
打印最近一個進程退出時的退出碼
errno:當庫函數調用失敗或者系統調用失敗 他們通常會將一個特定的錯誤代碼賦值給errno
?strerror是C語言的一個庫函數,該函數接收一個errno的錯誤代碼作為參數, strerror負責將這些錯誤代碼轉換為具體的錯誤描述信息,一共有134條
我們可以看到0表示成功? 1表示操作不被允許? 2表示沒有這個目錄或文件 3表示沒有這個進程
相信后面的大家也可以讀懂? 這樣我們就可以根據退出碼知道我們的錯誤是什么了
?
此時在當前目錄并沒有c.txt文件,ls是C語言寫的一個程序,當執行完程序,發現文件不存在,此時的退出碼是2,不就是上面的2號找不到文件嗎?
1.2進程常見的退出方法
1.2.1從main返回
我們知道main函數是程序的入口,當main函數結束,也return了,進程也就結束了
其他的函數只表示調用函數完成了 返回退出碼 并不代碼進程結束
1.2.2exit
exit手冊內容? ?exit是直接結束進程,引起進程終止? 它需要一個參數,就是狀態(進程退出碼)
1.2.3_exit?
_exit手冊內容? 用于終止進程的系統調用? 通過實驗我們發現和exit一樣都可以終止進程
?1.2.4exit和_exit區別
補充:我們知道只有OS才可以殺掉進程 庫和系統調用是上下層的關系 庫調用系統調用
相同點:都可以終止進程
不同點:
- exit是標準C庫函數 _exit是系統調用
- exit會刷新緩沖區 _exit不會刷新緩沖區
實驗:通過下面的實驗我們也可以驗證exit不會刷新緩沖區
2.進程等待
在理解進程等待前,我們先來想一下進程為什么要進行等待呢?
- 回收子進程資源(處理僵尸進程)
- 獲取子進程退出信息
我們知道當子進程退出時,task_struct不會被釋放,需要父進程回收資源,當父進程一直不管時,就可能會造成僵尸進程,可能會出現內存泄露
2.1wait?
手冊內容:wait的參數status是一個輸出型參數 在后續的waitpid我們會詳細了解
wait會等待任意一個子進程 回收成功會返回回收的pid
接下來我們來使用一下wait?
創建一個子進程 讓他跑五次 當子進程結束時,讓程序暫停10s,這個時候父進程還沒有回收資源,所以子進程此時就是僵尸進程,根據子進程狀態我們可以看到是Z,父進程回收子進程資源,解決了僵尸進程,返回了子進程的pid,子進程資源被全部釋放,剩余父進程,程序再休眠10s,最后父進程進程也結束
?2.2waitpid
pid_t waitpid(pid_t pid, int *status, int options);? waitpid共有三個參數
接下來會一個一個拆開分析:
?2.2.1pid_t pid
pid_id的值有四種
等待指定pid或者等待任意子進程?
?如果等待失敗 會出現什么樣的情況呢?
2.2.2int *status
輸出型參數 存儲進程退出時的狀態信息 不關心狀態信息設置NULL
我們來進行測試一下:發現出現了一些問題
status不能當做整型看待,可以當做位圖來看待,前16位不考慮,次8位是退出狀態,那么此時應該前7位是0,然后是1,后面還有8個0,因為是2進制,所以應該是2的8次方,也就是256!
當除數為0時就會使程序出現異常
????????其實exit code 和 exit signal都存放在子進程的task_struct中,當子進程是僵尸進程,等待父進程通過操作系統調用回收子進程資源,獲取子進程的退出信息
????????我們在上述的實驗是通過位操作來提取信息的,真正的OS是使用宏,其實就是封裝了一下位操作
- WIFEXITED(status): 若為正常終止子進程返回的狀態,則為真。(查看進程是
否是正常退出,程序是否異常,=0為真)
- WEXITSTATUS(status): 若WIFEXITED非零,提取子進程退出碼。(查看進程的
退出碼)

2.2.3int options?
補充:
- 阻塞調用:當一個程序發起操作時,程序會暫停操作,直到這個操作完成并返回結果,在執行操作時,程序不能做任何事,也就是子進程在執行任務時,父進程一直在wait阻塞
- 非阻塞調用:當一個程序發起操作,不會等操作完成,而是立即返回,執行后續的操作,程序可以定期檢查這個操作是否已經完成,這個操作叫做非阻塞輪詢
我們從手冊里可以看到options是有幾個選項的
- 默認是0:阻塞調用,如果子進程還沒有退出父進程就會一直阻塞在那里
- WNOHANG:非阻塞調用
waitpid的返回值可以是 -1? 0? >0
-1表示失敗
0表示 調用結束 但是子進程沒有退出
>0 子進程結束
非阻塞輪詢實驗,將waitpid的第三個參數設置為WNOHANG,非阻塞調用,這樣父進程就不會一直等待子進程完成任務,而是立即返回,然后定期去詢問子進程完成任務了嗎?
非阻塞調用實驗:我們可以通過函數指針回調函數來操作
通過實驗我們可以看到在子進程執行任務時,父進程也在執行其他任務
3.進程替換 exec
進程替換就是OS根據指定的程序文件路徑和參數,將新程序的代碼和數據加載到當前進程的地址空間中,覆蓋原來的進程內容,從而實現進程替換
程序替換錯誤返回-1 沒有成功返回值?
當我們知道程序替換會將原先的程序進行覆蓋,我們原先的程序就沒有了,所以我們一般會創建子進程去執行程序替換,這樣父進程的代碼數據也不會丟失了!!?
3.1進程替換的原理
我們先來使用一下execl,我們可以發現第一句printf執行了,然后執行程序替換,然后就沒有輸出了,我們來了解一下程序替換的原理!其實在上面就已近談到了,就是將新程序的代碼和數據加載到當前進程的地址空間中,覆蓋替換原來的進程內容,從而實現進程替換
在程序替換的過程中,并沒有創建新的進程
3.2程序替換接口函數
我們在上面的手冊中可以看到6個接口函數,接下來我們學習四個 后續的大家肯定就都懂
還有一個是系統命令 execve? 我們在上面看到的6個接口函數其實都是需要去調用execve
在上層進行封裝 為了應對各種各樣的場景 最后會統一轉化 調用系統調用execve
3.2.1execl
int execl(const char *path, const char *arg, ...);
execl的l可以看做是一個list,第一個參數就是路徑+程序名,第二個參數就是命令,在命令行怎么寫,這里我們就怎么寫,...是可變參數列表的意思,因為我們不知道命令有幾個,最后要以NULL結尾,表明參數已傳完!!
?3.2.2 execlp
int execlp(const char *file, const char *arg, ...);
?execlp的l看做list,p看做PATH,第一個參數就是要執行的文件名,execp會自動在環境變量PATH中查找命令,第二個參數就是命令,同上!
3.2.3execv?
int execv(const char *path, char *const argv[]);
execv的v可以看做是一個vector,第一個參數是要執行的路徑+文件名,第二個參數是一個指針數組,也就是命令行參數表?
3.2.4execvp
int execvp(const char *file, char *const argv[]);
execvp的v可以理解為vector,p理解為PATH,第一個參數就是要執行的文件,第二個是指針數組,就是指命令行參數表,相信大家看到這里一看就看懂了!!
3.2.5??execvpe
int execvpe(const char *file, char *const argv[], char *const envp[]);
execvpe的v可以看做vector,e看做environment,第一個參數就是要執行的文件,第二個就是命令行參數表,第三個也是一個指針數組,是環境變量表,這里的環境變量表會進行覆蓋替換父進程的環境變量表,當然也有方法在原始的環境變量表的基礎上進行添加!!
補充?
putenv 添加環境變量的參數
envrion 訪問當前環境的整個環境列表
解決方案 :
- 不使用需要傳帶env的參數 直接進行putenv
- 使用傳env的參數 putenv? envrion