進程與線程
??????典型的UNIX/Linux進程可以看成只有一個控制線程:一個進程在同一時刻只做一件事情。有了多個控制線程后,在程序設計時可以把進程設計成在同一時刻做不止一件事,每個線程各自處理獨立的任務。
?????? 進程是程序執行時的一個實例,是擔當分配系統資源(CPU時間、內存等)的基本單位。在面向線程設計的系統中,進程本身不是基本運行單位,而是線程的容器。程序本身只是指令、數據及其組織形式的描述,進程才是程序(那些指令和數據)的真正運行實例。
?????? “進程——資源分配的最小單位,線程——程序執行的最小單位”
??????一個進程至少包含一個線程,進程是運行的程序,程序是靜態的概念,進程是動態的概念。
??????進程有獨立的地址空間,一個進程崩潰后,在保護模式下不會對其它進程產生影響,而線程只是一個進程中的不同執行路徑。線程有自己的堆棧和局部變量,但線程沒有單獨的地址空間,一個線程死掉就等于整個進程死掉,所以多進程的程序要比多線程的程序健壯,但在進程切換時,耗費資源較大,效率要差一些。但對于一些要求同時進行并且又要共享某些變量的并發操作,可以用線程,也可以用進程間的通信。
使用線程的理由
??????從上面我們知道了進程與線程的區別,其實這些區別也就是我們使用線程的理由。總的來說就是:進程有獨立的地址空間,線程沒有單獨的地址空間(同一進程內的線程共享進程的地址空間)。
??????使用多線程的理由之一是和進程相比,它是一種非常"節儉"的多任務操作方式。我們知道,在Linux系統下,啟動一個新的進程必須分配給它獨立的地址空間,建立眾多的數據表來維護它的代碼段、堆棧段和數據段,這是一種"昂貴"的多任務工作方式。而運行于一個進程中的多個線程,它們彼此之間使用相同的地址空間,共享大部分數據,啟動一個線程所花費的空間遠遠小于啟動一個進程所花費的空間,而且,線程間彼此切換所需的時間也遠遠小于進程間切換所需要的時間。據統計,總的說來,一個進程的開銷大約是一個線程開銷的30倍左右,當然,在具體的系統上,這個數據可能會有較大的區別。
??????使用多線程的理由之二是線程間方便的通信機制。對不同進程來說,它們具有獨立的數據空間,要進行數據的傳遞只能通過通信的方式進行,這種方式不僅費時,而且很不方便。線程則不然,由于同一進程下的線程之間共享數據空間,所以一個線程的數據可以直接為其它線程所用,這不僅快捷,而且方便。當然,數據的共享也帶來其他一些問題,有的變量不能同時被兩個線程所修改,有的子程序中聲明為static的數據更有可能給多線程程序帶來災難性的打擊,這些正是編寫多線程程序時最需要注意的地方。
Linux上線程開發API概要
??????多線程開發在 Linux 平臺上已經有成熟的 pthread 庫支持。其涉及的多線程開發的最基本概念主要包含三點:線程,互斥鎖,條件。其中,線程操作又分線程的創建,退出,等待 3 種。互斥鎖則包括 4 種操作,分別是創建,銷毀,加鎖和解鎖。條件操作有 5 種操作:創建,銷毀,觸發,廣播和等待。其他的一些線程擴展概念,如信號燈等,都可以通過上面的三個基本元素的基本操作封裝出來。詳細請見下表:
1、線程創建
#include <pthread.h>
int pthread_create(pthread_t *restrict tidp, const pthread_attr_t *restrict attr, void *(*start_rtn)(void *), void *restrict arg);
// 返回:若成功返回0,否則返回錯誤編號
//pthread_t是無符號的長整型,第一個參數是pthread_t類型的指針,
//第個二參數是線程的屬性
//第三個參數是函數指針
//最后一個參數是給線程傳參的一個參數
當pthread_create成功返回時,由tidp指向的內存單元被設置為新創建線程的線程ID。attr參數用于定制各種不同的線程屬性,暫可以把它設置為NULL,以創建默認屬性的線程。
新創建的線程從start_rtn函數的地址開始運行,該函數只有一個無類型指針參數arg。如果需要向start_rtn函數傳遞的參數不止一個,那么需要把這些參數放到一個結構中,然后把這個結構的地址作為arg參數傳入。
線程的退出
單個線程可以通過以下三種方式退出,在不終止整個進程的情況下停止它的控制流:
1)線程只是從啟動例程中返回,返回值是線程的退出碼。
2)線程可以被同一進程中的其他線程取消。
3)線程調用pthread_exit:
pthread_exit函數
#include <pthread.h>
int pthread_exit(void *rval_ptr);
rval_ptr是一個無類型指針,與傳給啟動例程的單個參數類似。進程中的其他線程可以通過調用pthread_join函數訪問到這個指針。
線程等待
#include <pthread.h>
int pthread_join(pthread_t thread, void **rval_ptr);
// 返回:若成功返回0,否則返回錯誤編號
調用這個函數的線程將一直阻塞,直到指定的線程調用pthread_exit、從啟動例程中返回或者被取消。如果例程只是從它的啟動例程返回i,rval_ptr將包含返回碼。如果線程被取消,由rval_ptr指定的內存單元就置為PTHREAD_CANCELED。
可以通過調用pthread_join自動把線程置于分離狀態,這樣資源就可以恢復。如果線程已經處于分離狀態,pthread_join調用就會失敗,返回EINVAL。
如果對線程的返回值不感興趣,可以把rval_ptr置為NULL。在這種情況下,調用pthread_join函數將等待指定的線程終止,但并不獲得線程的終止狀態。
線程的脫離
一個線程或者是可匯合(joinable,默認值),或者是脫離的(detached)。當一個可匯合的線程終止時,它的線程ID和退出狀態將留存到另一個線程對它調用pthread_join。脫離的線程卻像守護進程,當它們終止時,所有相關的資源都被釋放,我們不能等待它們終止。如果一個線程需要知道另一線程什么時候終止,那就最好保持第二個線程的可匯合狀態。
pthread_detach函數把指定的線程轉變為脫離狀態。
#include <pthread.h>
int pthread_detach(pthread_t thread);
// 返回:若成功返回0,否則返回錯誤編號
本函數通常由想讓自己脫離的線程使用,就如以下語句:
pthread_detach(pthread_self());
線程ID獲取及比較
#include <pthread.h>
pthread_t pthread_self(void);
// 返回:調用線程的ID
對于線程ID比較,為了可移植操作,我們不能簡單地把線程ID當作整數來處理,因為不同系統對線程ID的定義可能不一樣。我們應該要用下邊的函數:
#include <pthread.h>
int pthread_equal(pthread_t tid1, pthread_t tid2);
// 返回:若相等則返回非0值,否則返回0
對于多線程程序來說,我們往往需要對這些多線程進行同步。同步(synchronization)是指在一定的時間內只允許某一個線程訪問某個資源。而在此時間內,不允許其它的線程訪問該資源。我們可以通過互斥鎖(mutex),條件變量(condition variable)和讀寫鎖(reader-writer lock)來同步資源。在這里,我們暫不介紹讀寫鎖。
代碼示例
#include<stdio.h>
#include<pthread.h>
//int pthread_create(pthread_t *restrict tidp, const pthread_attr_t *restrict attr, void *(*start_rtn)(void *), void *restrict arg);void*func1(void *arg)
{static int ret=10;//如果不是 static 函數調用結束后 ret 的值會消失static char*p="t1 is run out";printf("t1 :%ld thread is created\n",(unsigned long)pthread_self());printf("t1:param is %d\n",*((int*)arg));pthread_exit((void*)p);
}
int main()
{int ret;int param=100;char *pret;pthread_t t1;ret=pthread_create(&t1,NULL,func1,(void*)¶m);if(ret==0){printf("main:create t1 success\n");}printf("main : %ld \n",(unsigned long)pthread_self());pthread_join(t1,(void**)&pret);//這個函數用來等t1線程的退出,他是用在主線程中printf("main:t1 quite return is %s\n",pret);return 0;
}
體現線程共享內存空間代碼
{
#include<stdio.h>
#include<pthread.h>
//int pthread_create(pthread_t *restrict tidp, const pthread_attr_t *restrict attr, void *(*start_rtn)(void *), void *restrict arg);
int g_data=0;//主進程和進程1和進程2都共享這一個全局變量
void*func1(void *arg)
{printf("t1 :%ld thread is created\n",(unsigned long)pthread_self());printf("t1:param is %d\n",*((int*)arg));while(1){printf("t1 printf is %d\n",g_data++);sleep(1);}
}void*func2(void *arg)
{printf("t2 :%ld thread is created\n",(unsigned long)pthread_self());printf("t2:param is %d\n",*((int*)arg));while(1){printf("t2 printf is %d\n",g_data++);sleep(1);}
}int main()
{int ret;int param=100;pthread_t t1;pthread_t t2;ret=pthread_create(&t1,NULL,func1,(void*)¶m);if(ret==0){printf("main:create t1 success\n");}ret=pthread_create(&t2,NULL,func2,(void*)¶m);if(ret==0){printf("main:create t2 success\n");}printf("main : %ld \n",(unsigned long)pthread_self());while(1){printf("main printf is %d\n",g_data++);sleep(1);}pthread_join(t1,NULL);//yong laidengdai t1 xiancheng tuichupthread_join(t2,NULL);//yong laidengdai t1 xiancheng tuichureturn 0;
}
//c此程序三個進程的運行順序沒有確定誰先誰后