多線程的認識

競爭與協作

在單核 CPU 系統里，為了實現多個程序同時運行的假象，操作系統通常以時間片調度的方式，讓每個進程執行每次執行一個時間片，時間片用完了，就切換下一個進程運行，由于這個時間片的時間很短，于是就造成了「并發」的現象。

另外，操作系統也為每個進程創建巨大、私有的虛擬內存的假象，這種地址空間的抽象讓每個程序好像擁有自己的內存，而實際上操作系統在背后秘密地讓多個地址空間「復用」物理內存或者磁盤。

如果一個程序只有一個執行流程，也代表它是單線程的。當然一個程序可以有多個執行流程，也就是所謂的多線程程序，線程是調度的基本單位，進程則是資源分配的基本單位。

所以，線程之間是可以共享進程的資源，比如代碼段、堆空間、數據段、打開的文件等資源，但每個線程都有自己獨立的棧空間。

那么問題就來了，多個線程如果競爭共享資源，如果不采取有效的措施，則會造成共享數據的混亂。

假設現在創建了2個線程，要對i=i+1循環一千次，會出現什么結果？

假設 i == 100

線程 A 讀取 i = 100
線程 B 讀取 i = 100
A 執行 i + 1 得到 101，準備寫入
B 執行 i + 1 也得到 101，準備寫入
A 寫入 i = 101
B 也寫入 i = 101（把 A 的寫入覆蓋了）

本應 i = 102，但只加了 1，加1“丟失”了。

互斥的概念

上面展示的情況稱為競爭條件（race condition），當多線程相互競爭操作共享變量時，由于運氣不好，即在執行過程中發生了上下文切換，我們得到了錯誤的結果，事實上，每次運行都可能得到不同的結果，因此輸出的結果存在不確定性（indeterminate）。

由于多線程執行操作共享變量的這段代碼可能會導致競爭狀態，因此我們將此段代碼稱為臨界區（criticalsection），它是訪問共享資源的代碼片段，一定不能給多線程同時執行。

我們希望這段代碼是互斥（mutualexclusion）的，也就說保證一個線程在臨界區執行時，其他線程應該被阻止進入臨界區，說白了，就是這段代碼執行過程中，最多只能出現一個線程。

另外，說一下互斥也并不是只針對多線程。在多進程競爭共享資源的時候，也同樣是可以使用互斥的方式來避免資源競爭造成的資源混亂。

同步的概念

互斥解決了并發進程/線程對臨界區的使用問題。這種基于臨界區控制的交互作用是比較簡單的，只要一個進程/線程進入了臨界區，其他試圖想進入臨界區的進程/線程都會被阻塞著，直到第一個進程/線程離開了臨界區。

我們都知道在多線程里，每個線程并不一定是順序執行的，它們基本是以各自獨立的、不可預知的速度向前推進，但有時候我們又希望多個線程能密切合作，以實現一個共同的任務。

例子，線程 1 是負責讀入數據的，而線程 2 是負責處理數據的，這兩個線程是相互合作、相互依賴的。線程 2 在沒有收到線程 1 的喚醒通知時，就會一直阻塞等待，當線程 1 讀完數據需要把數據傳給線程 2時，線程 1 會喚醒線程 2，并把數據交給線程 2 處理。

所謂同步，就是并發進程/線程在一些關鍵點上可能需要互相等待與互通消息，這種相互制約的等待與互通信息稱為進程/線程同步。

互斥與同步的實現和使用

為了實現進程/線程間正確的協作，操作系統必須提供實現進程協作的措施和方法，主要的方法有兩種：

鎖：加鎖、解鎖操作；
信號量：P、V 操作；

這兩個都可以方便地實現進程/線程互斥，而信號量比鎖的功能更強一些，它還可以方便地實現進程/線程同步。

鎖

使用加鎖操作和解鎖操作可以解決并發線程/進程的互斥問題。

任何想進入臨界區的線程，必須先執行加鎖操作。若加鎖操作順利通過，則線程可進入臨界區；在完成對臨界資源的訪問后再執行解鎖操作，以釋放該臨界資源。

根據鎖的實現不同，可以分為「忙等待鎖」和「無忙等待鎖」。

忙等待鎖

在說明「忙等待鎖」的實現之前，先介紹現代 CPU 體系結構提供的特殊原子操作指令?—— 測試和置位（Test-and-Set）指令。

如果用 C 代碼表示 Test-and-Set 指令，形式如下：

int TestAndSet(int *old_ptr,int new){int old=*old_ptr;*old_ptr=new;return old;
}

測試并設置指令做了下述事情:

int *old_ptr：指向某個共享變量（通常是鎖變量）
int new：你想設置的新值（例如 1，表示“加鎖”）

當然，關鍵是這些代碼是原子執行。因為既可以測試舊值，又可以設置新值，所以我們把這條指令叫作「測試并設置」。

那什么是原子操作呢？原子操作就是要么全部執行，要么都不執行，不能出現執行到一半的中間狀態我們可以運用 Test-and-Set 指令來實現「忙等待鎖」，代碼如下：

我們來確保理解為什么這個鎖能工作：

第一個場景是，首先假設一個線程在運行，調用?lock()，沒有其他線程持有鎖，所以?flag?是 0。沒有其他線程持有鎖，所以?flag?是 0。沒有其他線程持有鎖，所以?flag?是 0。同時也會原子的設置flag 為1，標志鎖已經被持有。當線程離開臨界區，調用?unlock()?將?flag?清理為 0。
第二種場景是，當某一個線程已經持有鎖（即?flag?為1）。本線程調用?lock()，然后調用TestAndSet(flag, 1)，這一次返回 1。只要另一個線程一直持有鎖，TestAndSet()?會重復返回 1，本線程會一直忙等。當?flag?終于被改為 0，本線程會調用?TestAndSet()，返回 0 并且原子地設置為 1，從而獲得鎖，進入臨界區。

很明顯，當獲取不到鎖時，線程就會一直 while 循環，不做任何事情，所以就被稱為「忙等待鎖」，也被稱為自旋鎖（spin lock）。

這是最簡單的一種鎖，一直自旋，利用 CPU 周期，直到鎖可用。在單處理器上，需要搶占式的調度器（即不斷通過時鐘中斷一個線程，運行其他線程）。否則，自旋鎖在單 CPU 上無法使用，因為一個自旋的線程永遠不會放棄 CPU。

無等待鎖

無等待鎖顧明思議就是獲取不到鎖的時候，不用自旋。

既然不想自旋，那當沒獲取到鎖的時候，就把當前線程放入到鎖的等待隊列，然后執行調度程序，把 CPU讓給其他線程執行。

信號量

信號量是操作系統提供的一種協調共享資源訪問的方法。

通常信號量表示資源的數量，對應的變量是一個整型（sem）變量。

另外，還有兩個原子操作的系統調用函數來控制信號量的，分別是：

P 操作：將?sem?減?1，相減后，如果?sem < 0，則進程/線程進入阻塞等待，否則繼續，表明 P 操作可能會阻塞；
V 操作：將?sem?加?1，相加后，如果?sem <= 0，喚醒一個等待中的進程/線程，表明 V 操作不會阻塞；

P 操作是用在進入臨界區之前，V 操作是用在離開臨界區之后，這兩個操作是必須成對出現的。

PV 操作的函數是由操作系統管理和實現的，所以操作系統已經使得執行 PV 函數時是具有原子性的。

PV 操作如何使用的呢

我們先來說說如何使用信號量實現臨界區的互斥訪問。

為每類共享資源設置一個信號量?s，其初值為?1，表示該臨界資源未被占用。

任何想進入臨界區的線程，必先在互斥信號量上執行 P 操作，在完成對臨界資源的訪問后再執行 V操作。由于互斥信號量的初始值為 1，故在第一個線程執行 P 操作后 s 值變為 0，表示臨界資源為空閑，可分配給該線程，使之進入臨界區。

若此時又有第二個線程想進入臨界區，也應先執行 P 操作，結果使 s 變為負值，這就意味著臨界資源已被占用，因此，第二個線程被阻塞。

并且，直到第一個線程執行 V 操作，釋放臨界資源而恢復 s 值為 0 后，才喚醒第二個線程，使之進入臨界區，待它完成臨界資源的訪問后，又執行 V 操作，使 s 恢復到初始值 1。

對于兩個并發線程，互斥信號量的值僅取 1、0 和 -1 三個值，分別表示：

如果互斥信號量為 1，表示沒有線程進入臨界區；
如果互斥信號量為 0，表示有一個線程進入臨界區；
如果互斥信號量為 -1，表示一個線程進入臨界區，另一個線程等待進入。

通過互斥信號量的方式，就能保證臨界區任何時刻只有一個線程在執行，就達到了互斥的效果。

再來，我們說說如何使用信號量實現事件同步。

同步的方式是設置一個信號量，其初值為?0。

媽媽一開始詢問兒子要不要做飯時，執行的是?P(s1)?，相當于詢問兒子需不需要吃飯，由于?s1?初始值為 0，此時?s1?變成 -1，表明兒子不需要吃飯，所以媽媽線程就進入等待狀態。

當兒子肚子餓時，執行了?V(s1)，使得?s1?信號量從 -1 變成 0，表明此時兒子需要吃飯了，于是就喚醒了阻塞中的媽媽線程，媽媽線程就開始做飯。

接著，兒子線程執行了?P(s2)，相當于詢問媽媽飯做完了嗎，由于?s2?初始值是 0，則此時?s2?變成-1，說明媽媽還沒做完飯，兒子線程就等待狀態。最后，媽媽終于做完飯了，于是執行?V(s2)，s2?信號量從 -1 變回了 0，于是就喚醒等待中的兒子線程，喚醒后，兒子線程就可以進行吃飯了。

生產者-消費者問題

生產者-消費者問題描述：

生產者在生成數據后，放在一個緩沖區中；
消費者從緩沖區取出數據處理；
任何時刻，只能有一個生產者或消費者可以訪問緩沖區；

我們對問題分析可以得出：

任何時刻只能有一個線程操作緩沖區，說明操作緩沖區是臨界代碼，需要互斥；
緩沖區空時，消費者必須等待生產者生成數據；緩沖區滿時，生產者必須等待消費者取出數據。說明生產者和消費者需要同步。

那么我們需要三個信號量，分別是：

互斥信號量?mutex：用于互斥訪問緩沖區，初始化值為 1；
資源信號量?fullBuffers：用于消費者詢問緩沖區是否有數據，有數據則讀取數據，初始化值為 0（表明緩沖區一開始為空）；
資源信號量?emptyBuffers：用于生產者詢問緩沖區是否有空位，有空位則生成數據，初始化值為 n（緩沖區大小）；

如果消費者線程一開始執行?P(fullBuffers)，由于信號量?fullBuffers?初始值為 0，則此時fullBuffers?的值從 0 變為 -1，說明緩沖區里沒有數據，消費者只能等待。

接著，輪到生產者執行?P(emptyBuffers)，表示減少 1 個空槽，如果當前沒有其他生產者線程在臨界區執行代碼，那么該生產者線程就可以把數據放到緩沖區，放完后，執行?V(fullBuffers)?，信號量fullBuffers?從 -1 變成 0，表明有「消費者」線程正在阻塞等待數據，于是阻塞等待的消費者線程會被喚醒。

消費者線程被喚醒后，如果此時沒有其他消費者線程在讀數據，那么就可以直接進入臨界區，從緩沖區讀取數據。最后，離開臨界區后，把空槽的個數 + 1。

經典同步問題

先來看看哲學家就餐的問題描述：

5?個老大哥哲學家，閑著沒事做，圍繞著一張圓桌吃面；
巧就巧在，這個桌子只有?5?支叉子，每兩個哲學家之間放一支叉子；
哲學家圍在一起先思考，思考中途餓了就會想進餐；
奇葩的是，這些哲學家要兩支叉子才愿意吃面，也就是需要拿到左右兩邊的叉子才進餐；
吃完后，會把兩支叉子放回原處，繼續思考；

方案一

我們用信號量的方式，也就是 PV 操作來嘗試解決它，代碼如下：

上面的程序，好似很自然。拿起叉子用 P 操作，代表有叉子就直接用，沒有叉子時就等待其他哲學家放回叉子。

不過，這種解法存在一個極端的問題：假設五位哲學家同時拿起左邊的叉子，桌面上就沒有叉子了，這樣就沒有人能夠拿到他們右邊的叉子，也就說每一位哲學家都會在?P(fork[(i + 1) % N ])?這條語句阻塞了，很明顯這發生了死鎖的現象。

方案二

既然「方案一」會發生同時競爭左邊叉子導致死鎖的現象，那么我們就在拿叉子前，加個互斥信號量，代碼如下：

上面程序中的互斥信號量的作用就在于，只要有一個哲學家進入了「臨界區」，也就是準備要拿叉子時，其他哲學家都不能動，只有這位哲學家用完叉子了，才能輪到下一個哲學家進餐。

方案二雖然能讓哲學家們按順序吃飯，但是每次進餐只能有一位哲學家，而桌面上是有 5 把叉子，按道理是能可以有兩個哲學家同時進餐的，所以從效率角度上，這不是最好的解決方案。

方案三

那既然方案二使用互斥信號量，會導致只能允許一個哲學家就餐，那么我們就不用它。

另外，方案一的問題在于，會出現所有哲學家同時拿左邊刀叉的可能性，那我們就避免哲學家可以同時拿左邊的刀叉，采用分支結構，根據哲學家的編號的不同，而采取不同的動作。

即讓偶數編號的哲學家「先拿左邊的叉子后拿右邊的叉子」，奇數編號的哲學家「先拿右邊的叉子后拿左邊的叉子」。

上面的程序，在 P 操作時，根據哲學家的編號不同，拿起左右兩邊叉子的順序不同。另外，V 操作是不需要分支的，因為 V 操作是不會阻塞的。

方案四

在這里再提出另外一種可行的解決方案，我們用一個數組 state 來記錄每一位哲學家的三個狀態，分別是在進餐狀態、思考狀態、饑餓狀態（正在試圖拿叉子）。

那么，一個哲學家只有在兩個鄰居都沒有進餐時，才可以進入進餐狀態。

第?i?個哲學家的左鄰右舍，則由宏?LEFT?和?RIGHT?定義：

LEFT?: ( i + 5 - 1 ) % 5
RIGHT?: ( i + 1 ) % 5

具體代碼實現如下：

上面的程序使用了一個信號量數組，每個信號量對應一位哲學家，這樣在所需的叉子被占用時，想進餐的哲學家就被阻塞。

注意，每個進程/線程將?smart_person?函數作為主代碼運行，而其他?take_forks、put_forks?和test?只是普通的函數，而非單獨的進程/線程。

方案四同樣不會出現死鎖，也可以兩人同時進餐。

讀者-寫者問題

前面的「哲學家進餐問題」對于互斥訪問有限的競爭問題（如 I/O 設備）一類的建模過程十分有用。

另外，還有個著名的問題是「讀者-寫者」，它為數據庫訪問建立了一個模型。

讀者只會讀取數據，不會修改數據，而寫者即可以讀也可以修改數據。

讀者-寫者的問題描述：

「讀-讀」允許：同一時刻，允許多個讀者同時讀
「讀-寫」互斥：沒有寫者時讀者才能讀，沒有讀者時寫者才能寫
「寫-寫」互斥：沒有其他寫者時，寫者才能寫

方案一

使用信號量的方式來嘗試解決：

信號量?wMutex：控制寫操作的互斥信號量，初始值為 1 ；
讀者計數?rCount：正在進行讀操作的讀者個數，初始化為 0；
信號量?rCountMutex：控制對 rCount 讀者計數器的互斥修改，初始值為 1；

上面的這種實現，是讀者優先的策略，因為只要有讀者正在讀的狀態，后來的讀者都可以直接進入，如果讀者持續不斷進入，則寫者會處于饑餓狀態。

方案二

那既然有讀者優先策略，自然也有寫者優先策略：

只要有寫者準備要寫入，寫者應盡快執行寫操作，后來的讀者就必須阻塞；
如果有寫者持續不斷寫入，則讀者就處于饑餓；

在方案一的基礎上新增如下變量

信號量?rMutex：控制讀者進入的互斥信號量，初始值為 1；
信號量?wDataMutex：控制寫者寫操作的互斥信號量，初始值為 1；
寫者計數?wCount：記錄寫者數量，初始值為 0；
信號量?wCountMutex：控制 wCount 互斥修改，初始值為 1；

注意，這里?rMutex?的作用，開始有多個讀者讀數據，它們全部進入讀者隊列，此時來了一個寫者，執行了?P(rMutex)?之后，后續的讀者由于阻塞在?rMutex?上，都不能再進入讀者隊列，而寫者到來，則可以全部進入寫者隊列，因此保證了寫者優先。

同時，第一個寫者執行了?P(rMutex)?之后，也不能馬上開始寫，必須等到所有進入讀者隊列的讀者都執行完讀操作，通過?V(wDataMutex)?喚醒寫者的寫操作。

方案三

既然讀者優先策略和寫者優先策略都會造成饑餓的現象，那么我們就來實現一下公平策略。

公平策略：

優先級相同；
寫者、讀者互斥訪問；
只能一個寫者訪問臨界區；
可以有多個讀者同時訪問臨界資源；

開始來了一些讀者讀數據，它們全部進入讀者隊列，此時來了一個寫者，執行?P(falg)?操作，使得后續到來的讀者都阻塞在?flag?上，不能進入讀者隊列，這會使得讀者隊列逐漸為空，即?rCount?減為 0。這個寫者也不能立馬開始寫（因為此時讀者隊列不為空），會阻塞在信號量?wDataMutex?上，讀者隊列中的讀者全部讀取結束后，最后一個讀者進程執行?V(wDataMutex)，喚醒剛才的寫者，寫者則繼續開始進行寫操作。