進程與線程比較

進程是資源（包括內存、打開的文件等）分配的單位，線程是 CPU 調度的單位；
進程擁有一個完整的資源平臺，而線程只獨享必不可少的資源，如寄存器和棧；
線程同樣具有就緒、阻塞、執行三種基本狀態，同樣具有狀態之間的轉換關系；
線程能減少并發執行的時間和空間開銷；

線程相比進程能減少開銷，體現在：

線程的創建時間比進程快，因為進程在創建的過程中，還需要資源管理信息，比如內存管理信息、文件管理信息，而線程在創建的過程中，不會涉及這些資源管理信息，而是共享它們；
線程的終止時間比進程快，因為線程釋放的資源相比進程少很多；
同一個進程內的線程切換比進程切換快，因為線程具有相同的地址空間（虛擬內存共享），這意味著同一個進程的線程都具有同一個頁表，那么在切換的時候不需要切換頁表。而對于進程之間的切換，切換的時候要把頁表給切換掉，而頁表的切換過程開銷是比較大的；
由于同一進程的各線程間共享內存和文件資源，那么在線程之間數據傳遞的時候，就不需要經過內核了，這就使得線程之間的數據交互效率更高了

多線程

同步與互斥

多個線程如果競爭共享資源，如果不采取有效的措施，則會造成共享數據的混亂。

由于多線程執行操作共享變量的這段代碼可能會導致競爭狀態，因此我們將此段代碼稱為臨界區（*critical section*），它是訪問共享資源的代碼片段，一定不能給多線程同時執行。

我們希望這段代碼是互斥（mutualexclusion）的，也就說保證一個線程在臨界區執行時，其他線程應該被阻止進入臨界區

所謂同步，就是并發進程/線程在一些關鍵點上可能需要互相等待與互通消息，這種相互制約的等待與互通信息稱為進程/線程同步。

鎖：加鎖、解鎖操作；
信號量：P、V 操作；

這兩個都可以方便地實現進程/線程互斥，而信號量比鎖的功能更強一些，它還可以方便地實現進程/線程同步。

鎖分為無等待鎖與自旋鎖：

當獲取不到鎖時，線程就會一直 wile 循環，不做任何事情，所以就被稱為「忙等待鎖」，也被稱為自旋鎖（*spin lock*）。

無等待鎖顧明思議就是獲取不到鎖的時候，不用自旋。

既然不想自旋，那當沒獲取到鎖的時候，就把當前線程放入到鎖的等待隊列，然后執行調度程序，把 CPU 讓給其他線程執行。

信號量表示資源的數量，對應的變量是一個整型（sem）變量

P 操作：將 sem 減 1，相減后，如果 sem < 0，則進程/線程進入阻塞等待，否則繼續，表明 P 操作可能會阻塞；
V 操作：將 sem 加 1，相加后，如果 sem <= 0，喚醒一個等待中的進程/線程，表明 V 操作不會阻塞；

在這里插入圖片描述

對于兩個并發線程，互斥信號量的值僅取 1、0 和 -1 三個值，分別表示：

如果互斥信號量為 1，表示沒有線程進入臨界區；
如果互斥信號量為 0，表示有一個線程進入臨界區；
如果互斥信號量為 -1，表示一個線程進入臨界區，另一個線程等待進入。
通過互斥信號量的方式，就能保證臨界區任何時刻只有一個線程在執行，就達到了互斥的效果。

生產者與消費者

生產者在生成數據后，放在一個緩沖區中；
消費者從緩沖區取出數據處理；
任何時刻，只能有一個生產者或消費者可以訪問緩沖區；
任何時刻只能有一個線程操作緩沖區，說明操作緩沖區是臨界代碼，需要互斥；
緩沖區空時，消費者必須等待生產者生成數據；緩沖區滿時，生產者必須等待消費者取出數據。說明生產者和消費者需要同步。

我們需要三個信號量：

互斥信號量 mutex：用于互斥訪問緩沖區，初始化值為 1

資源信號量 fullBuffers：用于消費者詢問緩沖區是否有數據，有數據則讀取數據，初始化值為 0（表明緩沖區一開始為空）；

資源信號量 emptyBuffers：用于生產者詢問緩沖區是否有空位，有空位則生成數據，初始化值為 n （緩沖區大小）；

在這里插入圖片描述

哲學家就餐問題

在這里插入圖片描述

5 個老大哥哲學家，閑著沒事做，圍繞著一張圓桌吃面；
巧就巧在，這個桌子只有 5 支叉子，每兩個哲學家之間放一支叉子；
哲學家圍在一起先思考，思考中途餓了就會想進餐；
奇葩的是，這些哲學家要兩支叉子才愿意吃面，也就是需要拿到左右兩邊的叉子才進餐；
吃完后，會把兩支叉子放回原處，繼續思考；

那么問題來了，如何保證哲學家們的動作有序進行，而不會出現有人永遠拿不到叉子呢？

讓偶數編號的哲學家「先拿左邊的叉子后拿右邊的叉子」，奇數編號的哲學家「先拿右邊的叉子后拿左邊的叉子」

在這里插入圖片描述

上面的程序，在 P 操作時，根據哲學家的編號不同，拿起左右兩邊叉子的順序不同。另外，V 操作是不需要分支的，因為 V 操作是不會阻塞的。

讀者寫者問題

讀者只會讀取數據，不會修改數據，而寫者即可以讀也可以修改數據。

不談讀優先于寫優先鎖，直接談公平讀寫鎖。

公平策略：

開始來了一些讀者讀數據，它們全部進入讀者隊列，此時來了一個寫者，執行 P(falg) 操作，使得后續到來的讀者都阻塞在 flag 上，不能進入讀者隊列，這會使得讀者隊列逐漸為空，即 rCount 減為 0。

這個寫者也不能立馬開始寫（因為此時讀者隊列不為空），會阻塞在信號量 wDataMutex 上，讀者隊列中的讀者全部讀取結束后，最后一個讀者進程執行 V(wDataMutex)，喚醒剛才的寫者，寫者則繼續開始進行寫操作。
為此時讀者隊列不為空），會阻塞在信號量 wDataMutex 上，讀者隊列中的讀者全部讀取結束后，最后一個讀者進程執行 V(wDataMutex)，喚醒剛才的寫者，寫者則繼續開始進行寫操作。

進程間通信

每個進程的用戶地址空間都是獨立的，一般而言是不能互相訪問的，但內核空間是每個進程都共享的，所以進程之間要通信必須通過內核。

管道

管道傳輸數據是單向的，如果想相互通信，我們需要創建兩個管道才行。

匿名管道，用完了就銷毀。

命名管道，也被叫做 FIFO，因為數據是先進先出的傳輸方式

只有當管道里的數據被讀完后，命令才可以正常退出。

管道這種通信方式效率低，不適合進程間頻繁地交換數據。當然，它的好處，自然就是簡單，同時也我們很容易得知管道里的數據已經被另一個進程讀取了。

對于匿名管道，它的通信范圍是存在父子關系的進程。因為管道沒有實體，也就是沒有管道文件，只能通過 fork 來復制父進程 fd 文件描述符，來達到通信的目的。

對于命名管道，它可以在不相關的進程間也能相互通信。因為命令管道，提前創建了一個類型為管道的設備文件，在進程里只要使用這個設備文件，就可以相互通信。

消息隊列

A 進程要給 B 進程發送消息，A 進程把數據放在對應的消息隊列后就可以正常返回了，B 進程需要的時候再去讀取數據就可以了。

消息隊列是保存在內核中的消息鏈表，在發送數據時，會分成一個一個獨立的數據單元，也就是消息體（數據塊），消息體是用戶自定義的數據類型，消息的發送方和接收方要約定好消息體的數據類型，所以每個消息體都是固定大小的存儲塊，不像管道是無格式的字節流數據。如果進程從消息隊列中讀取了消息體，內核就會把這個消息體刪除。
消息隊列不適合比較大數據的傳輸，因為在內核中每個消息體都有一個最大長度的限制，同時所有隊列所包含的全部消息體的總長度也是有上限。

消息隊列通信過程中，存在用戶態與內核態之間的數據拷貝開銷，因為進程寫入數據到內核中的消息隊列時，會發生從用戶態拷貝數據到內核態的過程，同理另一進程讀取內核中的消息數據時，會發生從內核態拷貝數據到用戶態的過程。

共享內存

共享內存的機制，就是拿出一塊虛擬地址空間來，映射到相同的物理內存中。

這樣這個進程寫入的東西，另外一個進程馬上就能看到了，都不需要拷貝來拷貝去，傳來傳去，大大提高了進程間通信的速度。

信號量

了防止多進程競爭共享資源，而造成的數據錯亂，所以需要保護機制，使得共享的資源，在任意時刻只能被一個進程訪問。正好，信號量就實現了這一保護機制。

信號量其實是一個整型的計數器，主要用于實現進程間的互斥與同步，而不是用于緩存進程間通信的數據。

控制信號量的方式有兩種原子操作：

一個是 P 操作，這個操作會把信號量減去 -1，相減后如果信號量 < 0，則表明資源已被占用，進程需阻塞等待；相減后如果信號量 >= 0，則表明還有資源可使用，進程可正常繼續執行。
另一個是 V 操作，這個操作會把信號量加上 1，相加后如果信號量 <= 0，則表明當前有阻塞中的進程，于是會將該進程喚醒運行；相加后如果信號量 > 0，則表明當前沒有阻塞中的進程；

P 操作是用在進入共享資源之前，V 操作是用在離開共享資源之后，這兩個操作是必須成對出現的。

兩個進程互斥訪問共享內存，我們可以初始化信號量為 1。

在這里插入圖片描述

進程 A 在訪問共享內存前，先執行了 P 操作，由于信號量的初始值為 1，故在進程 A 執行 P 操作后信號量變為 0，表示共享資源可用，于是進程 A 就可以訪問共享內存。
若此時，進程 B 也想訪問共享內存，執行了 P 操作，結果信號量變為了 -1，這就意味著臨界資源已被占用，因此進程 B 被阻塞。
直到進程 A 訪問完共享內存，才會執行 V 操作，使得信號量恢復為 0，接著就會喚醒阻塞中的線程 B，使得進程 B 可以訪問共享內存，最后完成共享內存的訪問后，執行 V 操作，使信號量恢復到初始值 1。
信號初始化為 1，就代表著是互斥信號量，它可以保證共享內存在任何時刻只有一個進程在訪問，這就很好的保護了共享內存。

進程 A 是負責生產數據，而進程 B 是負責讀取數據，這兩個進程是相互合作、相互依賴的，進程 A 必須先生產了數據，進程 B 才能讀取到數據，所以執行是有前后順序的。

信號量來實現多進程同步的方式，我們可以初始化信號量為 0。

在這里插入圖片描述

如果進程 B 比進程 A 先執行了，那么執行到 P 操作時，由于信號量初始值為 0，故信號量會變為 -1，表示進程 A 還沒生產數據，于是進程 B 就阻塞等待；
接著，當進程 A 生產完數據后，執行了 V 操作，就會使得信號量變為 0，于是就會喚醒阻塞在 P 操作的進程 B；
最后，進程 B 被喚醒后，意味著進程 A 已經生產了數據，于是進程 B 就可以正常讀取數據了。