linux下僵尸進程(Defunct進程)的產生與避免

在測試基于 DirectFB+Gstreamer 的視頻聯播系統的一個 Demo 的時候,其中大量使用 system 調用的語句,例如在 menu 代碼中的 system("./play") ,而且多次執行,這種情況下,在 ps -ef 列表中出現了大量的 defunct 進程,對程序的運行時有害的。按說system的源碼中應該已經包含了wait,但也不能排除開發板上這個版本的system中可能沒有wait,總之,開發板上在調用system后添加wait之后,defunct進程不復存在了。

下面談談 defunct 進程,中文翻譯叫僵尸進程。下文整理于網絡以及APUE一書。

?

一、什么是僵尸進程

?

在UNIX 系統中,一個進程結束了,但是他的父進程沒有等待(調用wait / waitpid)他,那么他將變成一個僵尸進程。當用ps命令觀察進程的執行狀態時,看到這些進程的狀態欄為defunct。僵尸進程是一個早已死亡的進程,但在進程表(processs table)中仍占了一個位置(slot)。

?

但是如果該進程的父進程已經先結束了,那么該進程就不會變成僵尸進程。因為每個進程結束的時候,系統都會掃描當前系統中所運行的所有進程,看看有沒有哪個進程是剛剛結束的這個進程的子進程,如果是的話,就由Init進程來接管他,成為他的父進程,從而保證每個進程都會有一個父進程。而Init進程會自動wait其子進程,因此被Init接管的所有進程都不會變成僵尸進程。

?

二、UNIX下進程的運作方式

?

每個Unix進程在進程表里都有一個進入點(entry),核心進程執行該進程時使用到的一切信息都存儲在進入點。當用 ps 命令察看系統中的進程信息時,看到的就是進程表中的相關數據。當以fork()系統調用建立一個新的進程后,核心進程就會在進程表中給這個新進程分配一個進入點,然后將相關信息存儲在該進入點所對應的進程表內。這些信息中有一項是其父進程的識別碼。

?

子進程的結束和父進程的運行是一個異步過程,即父進程永遠無法預測子進程到底什么時候結束。那么會不會因為父進程太忙來不及 wait 子進程,或者說不知道子進程什么時候結束,而丟失子進程結束時的狀態信息呢?

?

不會。因為UNIX提供了一種機制可以保證,只要父進程想知道子進程結束時的狀態信息,就可以得到。這種機制就是:當子進程走完了自己的生命周期后,它會執行exit()系統調用,內核釋放該進程所有的資源,包括打開的文件,占用的內存等。但是仍然為其保留一定的信息(包括進程號the process ID,退出碼exit code,退出狀態the terminationstatus of the process,運行時間the amount of CPU time taken by the process等),這些數據會一直保留到系統將它傳遞給它的父進程為止,直到父進程通過wait / waitpid來取時才釋放。

?

也就是說,當一個進程死亡時,它并不是完全的消失了。進程終止,它不再運行,但是還有一些殘留的數據等待父進程收回。當父進程 fork() 一個子進程后,它必須用 wait() (或者 waitpid())等待子進程退出。正是這個 wait() 動作來讓子進程的殘留數據消失。

?

三、僵尸進程的危害

?

如果父進程不調用wait / waitpid的話,那么保留的那段信息就不會釋放,其進程號就會一直被占用,但是系統的進程表容量是有限的,所能使用的進程號也是有限的,如果大量的產生僵尸進程,將因為沒有可用的進程號而導致系統不能產生新的進程。


所以,defunct進程不僅占用系統的內存資源,影響系統的性能,而且如果其數目太多,還會導致系統癱瘓。而且,由于調度程序無法選中Defunct 進程,所以不能用kill命令刪除Defunct 進程,惟一的方法只有重啟系統。

?

四、僵尸進程的產生

?

如果子進程死亡時父進程沒有 wait(),通常用 ps 可以看到它被顯示為“<defunct>”,這樣就產生了僵尸進程。它將永遠保持這樣直到父進程 wait()。

?

由此可見,defunct進程的出現時間是在子進程終止后,但是父進程尚未讀取這些數據之前。利用這一點我們可以用下面的程序建立一個defunct 進程:

?

C代碼??收藏代碼

  1. #include?<stdio.h>??
  2. ??
  3. #include<sys/types.h>??
  4. ??
  5. main()??
  6. {??
  7. ??
  8. ????if(!fork())??
  9. ????{??
  10. ??
  11. ????????printf(“child?pid=%d\n”,?getpid());??
  12. ??
  13. ????????exit(0);??
  14. ??
  15. ????}??
  16. ??
  17. ????sleep(20);??
  18. ??
  19. ????printf(“parent?pid=%d?\n”,?getpid());??
  20. ??
  21. ????exit(0);??
  22. ??
  23. }??

?

當上述程序以后臺的方式執行時,第17行強迫程序睡眠20秒,讓用戶有時間輸入ps -e指令,觀察進程的狀態,我們看到進程表中出現了defunct進程。當父進程執行終止后,再用ps -e命令觀察時,我們會發現defunct進程也隨之消失。這是因為父進程終止后,init 進程會接管父進程留下的這些“孤兒進程”(orphan process),而這些“孤兒進程”執行完后,它在進程表中的進入點將被刪除。如果一個程序設計上有缺陷,就可能導致某個進程的父進程一直處于睡眠狀態或是陷入死循環,父進程沒有wait子進程,也沒有終止以使Init接管,該子進程執行結束后就變成了defunct進程,這個defunct 進程可能會一直留在系統中直到系統重新啟動。

?

?

在看一個產生僵尸進程的例子。

子進程要執行的程序test_prog

?

?

C代碼??收藏代碼

  1. //test.c??
  2. #include?<stdio.h>??
  3. int?main()??
  4. {??
  5. ????????int?i?=?0;??
  6. ????????for?(i?=?0?;?i?<?10;?i++)??
  7. ????????{??
  8. ????????????????printf?("child?time?%d\n",?i+1);??
  9. ????????????????sleep?(1);??
  10. ????????}??
  11. ????????return?0;??
  12. }??

?

?

?

父進程father的代碼father.c

?

?

C代碼??收藏代碼

  1. #include?<stdio.h>??
  2. #include?<unistd.h>??
  3. #include?<sys/types.h>??
  4. #include?<sys/wait.h>??
  5. int?main()??
  6. {??
  7. ????????int?pid?=?fork?();??
  8. ????????if?(pid?==?0)??
  9. ????????{??
  10. ????????????????system?("./test_prog");??
  11. ????????????????_exit?(0);??
  12. ????????}else??
  13. ????????{??
  14. ????????????????int?i?=?0;??
  15. ????????????????/*?
  16. ????????????????????????????????int?status?=?0;?
  17. ????????????????while?(!waitpid(pid,?&status,?WNOHANG))?
  18. ????????????????{?
  19. ????????????????????????printf?("father?waiting%d\n",?++i);?
  20. ????????????????????????sleep?(1);?
  21. ????????????????}*/??
  22. ????????????????while?(1)??
  23. ????????????????{??
  24. ????????????????????????printf?("father?waiting?over%d\n",?++i);??
  25. ????????????????????????sleep?(1);??
  26. ????????????????}??
  27. ????????????????return?0;??
  28. ????????}??
  29. ??
  30. }??

?

?

?

執行./father,當子進程退出后,由于父進程沒有對它的退出進行關注,會出現僵尸進程

?

?

C代碼??收藏代碼

  1. 20786?pts/0????00:00:00?father??
  2. 20787?pts/0????00:00:00?father?<defunct>??

?

?? ?總結:子進程成為 defunct 直到父進程 wait(),除非父進程忽略了 SIGCLD 。更進一步,父進程沒有 wait() 就消亡(仍假設父進程沒有忽略 SIGCLD )的子進程(活動的或者 defunct)成為 init 的子進程,init 著手處理它們。

?

五、如何避免僵尸進程

?

1、父進程通過wait和waitpid等函數等待子進程結束,這會導致父進程掛起。

?

在上個例子中,如果我們略作修改,在第8行sleep()系統調用前執行wait()或waitpid()系統調用,則子進程在終止后會立即把它在進程表中的數據返回給父進程,此時系統會立即刪除該進入點。在這種情形下就不會產生defunct進程。


2. 如果父進程很忙,那么可以用signal函數為SIGCHLD安裝handler。在子進程結束后,父進程會收到該信號,可以在handler中調用wait回收。

?

3. 如果父進程不關心子進程什么時候結束,那么可以用signal(SIGCLD, SIG_IGN)或signal(SIGCHLD, SIG_IGN)通知內核,自己對子進程的結束不感興趣,那么子進程結束后,內核會回收,并不再給父進程發送信號?


4. fork兩次,父進程fork一個子進程,然后繼續工作,子進程fork一個孫進程后退出,那么孫進程被init接管,孫進程結束后,init會回收。不過子進程的回收還要自己做。 下面就是Stevens給的采用兩次folk避免僵尸進程的示例:

?

?

C代碼??收藏代碼

  1. #include?"apue.h"??
  2. #include?<sys/wait.h>??
  3. ??
  4. int??
  5. main(void)??
  6. ...{??
  7. ?????pid_t????pid;??
  8. ??
  9. ????if?((pid?=?fork())?<?0)?...{??
  10. ?????????err_sys("fork?error");??
  11. ?????}?else?if?(pid?==?0)?...{?????/**//*?first?child?*/??
  12. ????????if?((pid?=?fork())?<?0)??
  13. ?????????????err_sys("fork?error");??
  14. ????????else?if?(pid?>?0)??
  15. ?????????????exit(0);????/**//*?parent?from?second?fork?==?first?child?*/??
  16. ????????/**//*?
  17. ??????????*?We're?the?second?child;?our?parent?becomes?init?as?soon?
  18. ??????????*?as?our?real?parent?calls?exit()?in?the?statement?above.?
  19. ??????????*?Here's?where?we'd?continue?executing,?knowing?that?when?
  20. ??????????*?we're?done,?init?will?reap?our?status.?
  21. ?????????*/??
  22. ?????????sleep(2);??
  23. ?????????printf("second?child,?parent?pid?=?%d?",?getppid());??
  24. ?????????exit(0);??
  25. ?????}??
  26. ??????
  27. ????if?(waitpid(pid,?NULL,?0)?!=?pid)??/**//*?wait?for?first?child?*/??
  28. ?????????err_sys("waitpid?error");??
  29. ??
  30. ????/**//*?
  31. ??????*?We're?the?parent?(the?original?process);?we?continue?executing,?
  32. ??????*?knowing?that?we're?not?the?parent?of?the?second?child.?
  33. ?????*/??
  34. ?????exit(0);??
  35. }??

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/384975.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/384975.shtml
英文地址,請注明出處:http://en.pswp.cn/news/384975.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

文件操作函數

fopen()函數參數&#xff1a; r 只讀的方式打開文件。 打開成功返回文件指針&#xff0c; 打開失敗返回NULL r 以讀寫方式打開文件。 文件必須存在 rb 以二進制模式讀寫文件&#xff0c;文件必須存在 rw 讀寫一個二進制文件&#xff0c;允許讀和寫 w 打開只寫文件&…

讀過的最好的epoll講解

首先我們來定義流的概念&#xff0c;一個流可以是文件&#xff0c;socket&#xff0c;pipe等等可以進行I/O操作的內核對象。 不管是文件&#xff0c;還是套接字&#xff0c;還是管道&#xff0c;我們都可以把他們看作流。 之后我們來討論I/O的操作&#xff0c;通過read&#xf…

文件操作函數(讀寫)

文件文本排序&#xff1a; 數組冒泡&#xff1a; #include<stdio.h>void swap(int *a,int *b) {int temp *a;*a *b;*b temp; }void bubble(int *p,int n) {int i;int j;for(i 0; i < n; i){for(j 1; j < n - i; j){if(p[j - 1] > p[j]){swap(&p[j-1],&…

文件操作(升級)

計算字符串“25 32 ” #include<stdio.h> #include<string.h>int calc_string(char *s) {char buf1[100] {0};char oper 0;char buf2[100] {0};int len strlen(s);int i;for(i 0; i < len; i){if( s[i] || - s[i] || * s[i] || / s[i] ){strncpy…

C語言指針轉換為intptr_t類型

C語言指針轉換為intptr_t類型 1、前言 今天在看代碼時&#xff0c;發現將之一個指針賦值給一個intptr_t類型的變量。由于之前沒有見過intptr_t這樣數據類型&#xff0c;憑感覺認為intptr_t是int類型的指針。感覺很奇怪&#xff0c;為何要將一個指針這樣做呢&#xff1f;如是果…

nginx epoll詳解

nginx epoll 事件模型 nginx做為一個異步高效的事件驅動型web服務器&#xff0c;在linux平臺中當系統支持epoll時nginx默認采用epoll來高效的處理事件。nginx中使用ngx_event_t結構來表示一個事件&#xff0c;先介紹下ngx_event_t結構體中成員的含義&#xff1a; struct ngx_ev…

Inotify機制

描述 Inotify API用于檢測文件系統變化的機制。Inotify可用于檢測單個文件&#xff0c;也可以檢測整個目錄。當檢測的對象是一個目錄的時候&#xff0c;目錄本身和目錄里的內容都會成為檢測的對象。 此種機制的出現的目的是當內核空間發生某種事件之后&#xff0c;可以立即通…

文件操作(二進制文件加密解密)

加密 #include<stdio.h> #include<string.h>void code(char *p,size_t n) {size_t i;for(i 0; i < n; i){p[i] 3;} }int main() {FILE *p1 fopen("./a.txt","r");FILE *p2 fopen("./b.txt","w");char buf[1024] {…

北京加密機現場select問題

問題描述 北京項目通過調用我們提供的庫libsigxt.a與加密機通信&#xff0c;c/s架構&#xff0c;客戶端啟用多個線程&#xff0c;每個線程流程有以下三步&#xff0c;連接加密機&#xff0c;簽名&#xff0c;關閉鏈接。在正常運行一段時間后會出現不能連接加密機服務問題。 連…

拼接字符串(帶參程序)

1.用strcat拼接函數可以實現 #include<stdio.h> #include<string.h>int main(int argc,char ** argv) {char str[100] {0};int i;for( i 1; i < argc; i){strcat(str,argv[i]);}printf("str %s\n",str);return 0; } 2.用sprintf函數也可以實現 #in…

詳細解釋signal和sigaction以及SIG_BLOCK

signal&#xff0c;此函數相對簡單一些&#xff0c;給定一個信號&#xff0c;給出信號處理函數則可&#xff0c;當然&#xff0c;函數簡單&#xff0c;其功能也相對簡單許多&#xff0c;簡單給出個函數例子如下&#xff1a; [cpp] view plain copy 1 #include <signal.h>…

處理SIGCHLD信號

在上一講中&#xff0c;我們使用fork函數得到了一個簡單的并發服務器。然而&#xff0c;這樣的程序有一個問題&#xff0c;就是當子進程終止時&#xff0c;會向父進程發送一個SIGCHLD信號&#xff0c;父進程默認忽略&#xff0c;導致子進程變成一個僵尸進程。僵尸進程一定要處理…

文件操作(stat)

/*** stat.c ***/ #include<stdio.h> #include<string.h> #include<sys/stat.h> #include<stdlib.h>int main() {struct stat st {0}; //定義一個結構體&#xff0c;名字叫ststat("./a.txt",&st); //調用完stat函數之后&…

nginx源碼閱讀(一).綜述

前言 nginx作為一款開源的輕量級高性能web服務器,是非常值得立志從事服務端開發方向的人學習的。現今nginx的最新版本是nginx-1.13.6,代碼量也日漸龐大,但是由于其核心思想并沒改變,為了降低閱讀難度,我選擇的是nginx-1.0.15版本,并且由于時間和水平有限,重點關注的是nginx的啟…

文件操作(stat函數)

stat函數可以獲取文件信息 /*** stat.c ***/ #include<stdio.h> #include<string.h> #include<sys/stat.h> #include<stdlib.h>int main() {struct stat st {0}; //定義一個結構體&#xff0c;名字叫ststat("./a.txt",&st); …

文件操作(結構體)

將結構體內容寫入到文件中 #include<stdio.h> #include<string.h>struct student {char name[100];int age; };int main() {struct student st {"wangqinghe",30};FILE * p fopen("./c.txt","wb");fwrite(&st,sizeof(st),1,p…

nginx源碼閱讀(二).初始化:main函數及ngx_init_cycle函數

前言 在分析源碼時,我們可以先把握主干,然后其他部分再挨個分析就行了。接下來我們先看看nginx的main函數干了些什么。 main函數 這里先介紹一些下面會遇到的變量類型: ngx_int_t: typedef intptr_t ngx_int_t; 64位機器上,intptr_t為long int, 即typedef long int intptr_…

EAGAIN、EWOULDBLOCK、EINTR與非阻塞

EWOULDBLOCK&#xff1a;用于非阻塞模式&#xff0c;不需要重新讀或者寫 EINTR&#xff1a;指操作被中斷喚醒&#xff0c;需要重新讀/寫   在Linux環境下開發經常會碰到很多錯誤(設置errno)&#xff0c;其中EAGAIN是其中比較常見的一個錯誤(比如用在非阻塞操作中)。 從字面上…

文件操作(排序)

文本文件&#xff0c;每行代表一個整數&#xff0c;范圍在0~512之間&#xff1b; 要求&#xff1a;對文件排序&#xff0c;不使用堆空間&#xff0c;只使用棧空間。 用srand()和rand()函數生成一定量的隨機數 /*** file.c ***/ #include<stdio.h> #include<string.h&g…

Linux下send錯誤代碼32

問題描述&#xff1a;今天寫程序&#xff0c;socket后send出現這個問題&#xff0c;send的返回值為-1&#xff0c;而errno為32&#xff0c;這個錯誤代碼為broken pipe&#xff0c;即管道破裂。 問題形成原因&#xff1a;后來通過排查研究&#xff0c;發現出現該種問題出現的可能…