Java的線程模型

并發不一定要依賴多線程（如PHP中很常見的多進程并發），但是在Java里面談論并發，大多數都與線程脫不開關系。

線程是比進程更輕量級的調度執行單位，線程的引入，可以把一個進程的資源分配和執行調度分開，各個線程既可以共享進程資源（內存地址、文件I/O等），又可以獨立調度（線程是CPU調度的基本單位）。

主流的操作系統都提供了線程實現，Java語言則提供了在不同硬件和操作系統平臺下對線程操作的統一處理，每個已經執行start（）且還未結束的java.lang.Thread類的實例就代表了一個線程。我們注意到Thread類與大部分的Java API有顯著的差別，它的所有關鍵方法都是聲明為Native的。在Java API中，一個Native方法往往意味著這個方法沒有使用或無法使用平臺無關的手段來實現（當然也可能是為了執行效率而使用Native方法，不過，通常最高效率的手段也就是平臺相關的手段）。

線程的實現

實現線程主要有3種方式：使用內核線程實現、使用用戶線程實現和使用用戶線程加輕量級進程混合實現。

使用內核線程實現

內核線程（Kernel-Level Thread,KLT）就是直接由操作系統內核（Kernel，下稱內核）支持的線程，這種線程由內核來完成線程切換，內核通過操縱調度器（Scheduler）對線程進行調度，并負責將線程的任務映射到各個處理器上。每個內核線程可以視為內核的一個分身，這樣操作系統就有能力同時處理多件事情，支持多線程的內核就叫做多線程內核（Multi-Threads Kernel）。

程序一般不會直接去使用內核線程，而是去使用內核線程的一種高級接口——輕量級進程（Light Weight Process,LWP），輕量級進程就是我們通常意義上所講的線程，由于每個輕量級進程都由一個內核線程支持，因此只有先支持內核線程，才能有輕量級進程。這種輕量級進程與內核線程之間1:1的關系稱為一對一的線程模型。

由于內核線程的支持，每個輕量級進程都成為一個獨立的調度單元，即使有一個輕量級進程在系統調用中阻塞了，也不會影響整個進程繼續工作，但是輕量級進程具有它的局限性：

首先，由于是基于內核線程實現的，所以各種線程操作，如創建、析構及同步，都需要進行系統調用。而系統調用的代價相對較高，需要在用戶態（User Mode）和內核態（Kernel Mode）中來回切換。

其次，每個輕量級進程都需要有一個內核線程的支持，因此輕量級進程要消耗一定的內核資源（如內核線程的棧空間），因此一個系統支持輕量級進程的數量是有限的。

使用用戶線程實現

從廣義上來講，一個線程只要不是內核線程，就可以認為是用戶線程（User Thread,UT），因此，從這個定義上來講，輕量級進程也屬于用戶線程，但輕量級進程的實現始終是建立在內核之上的，許多操作都要進行系統調用，效率會受到限制。

而狹義上的用戶線程指的是完全建立在用戶空間的線程庫上，系統內核不能感知線程存在的實現。用戶線程的建立、同步、銷毀和調度完全在用戶態中完成，不需要內核的幫助。如果程序實現得當，這種線程不需要切換到內核態，因此操作可以是非常快速且低消耗的，也可以支持規模更大的線程數量，部分高性能數據庫中的多線程就是由用戶線程實現的。這種進程與用戶線程之間1：N的關系稱為一對多的線程模型。

使用用戶線程的優勢在于不需要系統內核支援，劣勢也在于沒有系統內核的支援，所有的線程操作都需要用戶程序自己處理。線程的創建、切換和調度都是需要考慮的問題，而且由于操作系統只把處理器資源分配到進程，那諸如“阻塞如何處理”、“多處理器系統中如何將線程映射到其他處理器上”這類問題解決起來將會異常困難，甚至不可能完成。因而使用用戶線程實現的程序一般都比較復雜，此處所講的“復雜”與“程序自己完成線程操作”，并不限制程序中必須編寫了復雜的實現用戶線程的代碼，使用用戶線程的程序，很多都依賴特定的線程庫來完成基本的線程操作，這些復雜性都封裝在線程庫之中，除了以前在不支持多線程的操作系統中（如DOS）的多線程程序與少數有特殊需求的程序外，現在使用用戶線程的程序越來越少了，Java、Ruby等語言都曾經使用過用戶線程，最終又都放棄使用它。

使用用戶線程加輕量級進程混合實現

線程除了依賴內核線程實現和完全由用戶程序自己實現之外，還有一種將內核線程與用戶線程一起使用的實現方式。在這種混合實現下，既存在用戶線程，也存在輕量級進程。用戶線程還是完全建立在用戶空間中，因此用戶線程的創建、切換、析構等操作依然廉價，并且可以支持大規模的用戶線程并發。而操作系統提供支持的輕量級進程則作為用戶線程和內核線程之間的橋梁，這樣可以使用內核提供的線程調度功能及處理器映射，并且用戶線程的系統調用要通過輕量級線程來完成，大大降低了整個進程被完全阻塞的風險。在這種混合模式中，用戶線程與輕量級進程的數量比是不定的，即為N：M的關系。許多UNIX系列的操作系統，如Solaris、HP-UX等都提供了N：M的線程模型實現。

Java線程的實現

對于Sun JDK來說，它的Windows版與Linux版都是使用一對一的線程模型實現的，一條Java線程就映射到一條輕量級進程之中，因為Windows和Linux系統提供的線程模型就是一對一的。

在Solaris平臺中，由于操作系統的線程特性可以同時支持一對一（通過Bound Threads或Alternate Libthread實現）及多對多（通過LWP/Thread Based Synchronization實現）的線程模型，因此在Solaris版的JDK中也對應提供了兩個平臺專有的虛擬機參數：-XX：+UseLWPSynchronization（默認值）和-XX：+UseBoundThreads來明確指定虛擬機使用哪種線程模型。

Java線程調度

線程調度是指系統為線程分配處理器使用權的過程，主要調度方式有兩種，分別是協同式線程調度（Cooperative Threads-Scheduling）和搶占式線程調度（Preemptive Threads-Scheduling）。

協同式調度

如果使用協同式調度的多線程系統，線程的執行時間由線程本身來控制，線程把自己的工作執行完了之后，要主動通知系統切換到另外一個線程上。協同式多線程的最大好處是實現簡單，而且由于線程要把自己的事情干完后才會進行線程切換，切換操作對線程自己是可知的，所以沒有什么線程同步的問題。Lua語言中的“協同例程”就是這類實現。它的壞處也很明顯：線程執行時間不可控制，甚至如果一個線程編寫有問題，一直不告知系統進行線程切換，那么程序就會一直阻塞在那里。很久以前的Windows 3.x系統就是使用協同式來實現多進程多任務的，相當不穩定，一個進程堅持不讓出CPU執行時間就可能會導致整個系統崩潰。

搶占式調度

如果使用搶占式調度的多線程系統，那么每個線程將由系統來分配執行時間，線程的切換不由線程本身來決定（在Java中，Thread.yield（）可以讓出執行時間，但是要獲取執行時間的話，線程本身是沒有什么辦法的）。在這種實現線程調度的方式下，線程的執行時間是系統可控的，也不會有一個線程導致整個進程阻塞的問題，Java使用的線程調度方式就是搶占式調度。在JDK后續版本中有可能會提供協程（Coroutines）方式來進行多任務處理。與前面所說的Windows 3.x的例子相對，在Windows 9x/NT內核中就是使用搶占式來實現多進程的，當一個進程出了問題，我們還可以使用任務管理器把這個進程“殺掉”，而不至于導致系統崩潰。

線程優先級

雖然Java線程調度是系統自動完成的，但是我們還是可以“建議”系統給某些線程多分配一點執行時間，另外的一些線程則可以少分配一點——這項操作可以通過設置線程優先級來完成。Java語言一共設置了10個級別的線程優先級（Thread.MIN_PRIORITY至Thread.MAX_PRIORITY），在兩個線程同時處于Ready狀態時，優先級越高的線程越容易被系統選擇執行。不過，線程優先級并不是太靠譜，原因是Java的線程是通過映射到系統的原生線程上來實現的，所以線程調度最終還是取決于操作系統，雖然現在很多操作系統都提供線程優先級的概念，但是并不見得能與Java線程的優先級一一對應，如Solaris中有2147483648（232）種優先級，但Windows中就只有7種，比Java線程優先級多的系統還好說，中間留下一點空位就可以了，但比Java線程優先級少的系統，就不得不出現幾個優先級相同的情況了，表12-1顯示了Java線程優先級與Windows線程優先級之間的對應關系，Windows平臺的JDK中使用了除THREAD_PRIORITY_IDLE之外的其余6種線程優先級。

上文說到“線程優先級并不是太靠譜”，不僅僅是說在一些平臺上不同的優先級實際會變得相同這一點，還有其他情況讓我們不能太依賴優先級：優先級可能會被系統自行改變。例如，在Windows系統中存在一個稱為“優先級推進器”（Priority Boosting，當然它可以被關閉掉）的功能，它的大致作用就是當系統發現一個線程執行得特別“勤奮努力”的話，可能會越過線程優先級去為它分配執行時間。因此，我們不能在程序中通過優先級來完全準確地判斷一組狀態都為Ready的線程將會先執行哪一個。

線程狀態轉換

Java語言定義了5種線程狀態，在任意一個時間點，一個線程只能有且只有其中的一種狀態，這5種狀態分別如下。

新建（New）：創建后尚未啟動的線程處于這種狀態。
運行（Runable）：Runable包括了操作系統線程狀態中的Running和Ready，也就是處于此狀態的線程有可能正在執行，也有可能正在等待著CPU為它分配執行時間。
無限期等待（Waiting）：處于這種狀態的線程不會被分配CPU執行時間，它們要等待被其他線程顯式地喚醒。以下方法會讓線程陷入無限期的等待狀態：