Golang 并發機制 CSP模型
1 前言
go語言的最大兩個亮點,一個是 goroutine
,一個就是 chan
了。二者合體的典型應用CSP,基本就是大家認可的并行開發神器,簡化了并行程序的開發難度,我們來看一下CSP。
2 CSP是什么
CSP
是 Communicating Sequential Process
的簡稱,中文可以叫做 通信順序進程 ,是一種并發編程模型,是一個很強大的并發數據模型,是上個世紀七十年代提出的,用于描述兩個獨立的并發實體通過共享的通訊 channel(管道)
進行通信的并發模型。相對于Actor模型,CSP中channel是第一類對象,它不關注發送消息的實體,而關注與發送消息時使用的channel。
嚴格來說,CSP 是一門形式語言(類似于calculus),用于描述并發系統中的互動模式,也因此成為一眾面向并發的編程語言的理論源頭,并衍生出了 Occam/Limbo/Golang…
而具體到編程語言,如 Golang,其實只用到了 CSP 的很小一部分,即理論中的 Process/Channel(對應到語言中的 goroutine/channel):這兩個并發原語之間沒有從屬關系, Process 可以訂閱任意個 Channel,Channel 也并不關心是哪個 Process 在利用它進行通信;Process 圍繞 Channel 進行讀寫,形成一套有序阻塞和可預測的并發模型。
3 Golang CSP
與主流語言通過共享內存來進行并發控制方式不同,Go 語言采用了 CSP 模式。這是一種用于描述兩個獨立的并發實體通過共享的通訊 Channel(管道)進行通信的并發模型。
Golang 就是借用CSP模型的一些概念為之實現并發進行理論支持,其實從實際上出發,go語言并沒有完全實現了CSP模型的所有理論,僅僅是借用了 process和channel這兩個概念。process是在go語言上的表現就是 goroutine 是實際并發執行的實體,每個實體之間是通過channel通訊來實現數據共享。
Go語言的CSP模型是由協程Goroutine與通道Channel實現:
- Go協程goroutine: 是一種輕量線程,它不是操作系統的線程,而是將一個操作系統線程分段使用,通過調度器實現協作式調度。是一種綠色線程,微線程,它與Coroutine協程也有區別,能夠在發現堵塞后啟動新的微線程。
- 通道channel: 類似Unix的Pipe,用于協程之間通訊和同步。協程之間雖然解耦,但是它們和Channel有著耦合。
4 Channel
Goroutine 和 channel 是 Go 語言并發編程的 兩大基石。Goroutine 用于執行并發任務,channel 用于 goroutine 之間的同步、通信。
Channel 在 gouroutine 間架起了一條管道,在管道里傳輸數據,實現 gouroutine 間的通信;由于它是線程安全的,所以用起來非常方便;channel 還提供 “先進先出” 的特性;它還能影響 goroutine 的阻塞和喚醒。
相信大家一定見過一句話:
Do not communicate by sharing memory; instead, share memory by communicating.
不要通過共享內存來通信,而要通過通信來實現內存共享。
這就是 Go 的并發哲學,它依賴 CSP 模型,基于 channel 實現。
channel 實現 CSP
Channel 是 Go 語言中一個非常重要的類型,是 Go 里的第一對象。通過 channel,Go 實現了通過通信來實現內存共享。Channel 是在多個 goroutine 之間傳遞數據和同步的重要手段。
使用原子函數、讀寫鎖可以保證資源的共享訪問安全,但使用 channel 更優雅。
channel 字面意義是 “通道”,類似于 Linux 中的管道。聲明 channel 的語法如下:
chan T // 聲明一個雙向通道
chan<- T // 聲明一個只能用于發送的通道
<-chan T // 聲明一個只能用于接收的通道COPY
單向通道的聲明,用 <-
來表示,它指明通道的方向。你只要明白,代碼的書寫順序是從左到右就馬上能掌握通道的方向是怎樣的。
因為 channel 是一個引用類型,所以在它被初始化之前,它的值是 nil
,channel 使用 make 函數進行初始化。可以向它傳遞一個 int 值,代表 channel 緩沖區的大小(容量),構造出來的是一個緩沖型的 channel;不傳或傳 0 的,構造的就是一個非緩沖型的 channel。
兩者有一些差別:非緩沖型 channel 無法緩沖元素,對它的操作一定順序是 “ 發送 -> 接收 -> 發送 -> 接收 -> ……”
,如果想連續向一個非緩沖 chan 發送 2 個元素,并且沒有接收的話,第一次一定會被阻塞;對于緩沖型 channel 的操作,則要 “寬松” 一些,畢竟是帶了 “緩沖” 光環。
通道(channel)模型
對 chan 的發送和接收操作都會在編譯期間轉換成為底層的發送接收函數。
Channel 分為兩種:帶緩沖、不帶緩沖。對不帶緩沖的 channel 進行的操作實際上可以看作 “同步模式”,帶緩沖的則稱為 “異步模式”。
同步模式下,發送方和接收方要同步就緒,只有在兩者都 ready 的情況下,數據才能在兩者間傳輸(后面會看到,實際上就是內存拷貝)。否則,任意一方先行進行發送或接收操作,都會被掛起,等待另一方的出現才能被喚醒。
異步模式下,在緩沖槽可用的情況下(有剩余容量),發送和接收操作都可以順利進行。否則,操作的一方(如寫入)同樣會被掛起,直到出現相反操作(如接收)才會被喚醒。
- 同步模式下,必須要使發送方和接收方配對,操作才會成功,否則會被阻塞;
- 異步模式下,緩沖槽要有剩余容量,操作才會成功,否則也會被阻塞。
簡單來說,CSP 模型由并發執行的實體(線程或者進程或者協程)所組成,實體之間通過發送消息進行通信,
這里發送消息時使用的就是通道,或者叫 channel。
CSP 模型的關鍵是關注 channel,而不關注發送消息的實體。Go 語言實現了 CSP 部分理論,goroutine 對應 CSP 中并發執行的實體,channel 也就對應著 CSP 中的 channel。
5 Goroutine
Goroutine 是實際并發執行的實體,它底層是使用協程(coroutine)實現并發,coroutine是一種運行在用戶態的用戶線程,類似于 greenthread,go底層選擇使用coroutine的出發點是因為,它具有以下特點:
- 用戶空間 避免了內核態和用戶態的切換導致的成本
- 可以由語言和框架層進行調度
- 更小的棧空間允許創建大量的實例
可以看到第二條 用戶空間線程的調度不是由操作系統來完成的,像在java 1.3中使用的greenthread的是由JVM統一調度的(后java已經改為內核線程),還有在ruby中的fiber(半協程) 是需要在重新中自己進行調度的,而goroutine是在golang層面提供了調度器,并且對網絡IO庫進行了封裝,屏蔽了復雜的細節,對外提供統一的語法關鍵字支持,簡化了并發程序編寫的成本。
6 Goroutine 調度器
Go并發調度: GPM模型
在操作系統提供的內核線程之上,Go搭建了一個特有的兩級線程模型。goroutine機制實現了M : N的線程模型,goroutine機制是協程(coroutine)的一種實現,golang內置的調度器,可以讓多核CPU中每個CPU執行一個協程。
7 總結
Golang 的 channel 將 goroutine 隔離開,并發編程的時候可以將注意力放在 channel 上。在一定程度上,這個和消息隊列的解耦功能還是挺像的。如果大家感興趣,還是來看看 channel 的源碼吧,對于更深入地理解 channel 還是挺有用的。
Go 通過 channel 實現 CSP 通信模型,主要用于 goroutine 之間的消息傳遞和事件通知。
有了 channel 和 goroutine 之后,Go 的并發編程變得異常容易和安全,得以讓程序員把注意力留到業務上去,實現開發效率的提升。
參考
- https://blog.csdn.net/kenkao/article/details/124255627