高性能IO模型淺析

服務器端編程經常需要構造高性能的IO模型,常見的IO模型有四種:

(1)同步阻塞IO(Blocking?IO):即傳統的IO模型。

(2)同步非阻塞IO(Non-blocking?IO):默認創建的socket都是阻塞的,非阻塞IO要求socket被設置為NONBLOCK。注意這里所說的NIO并非Java的NIO(New?IO)庫。

(3)IO多路復用(IO?Multiplexing):即經典的Reactor設計模式,有時也稱為異步阻塞IO,Java中的Selector和Linux中的epoll都是這種模型。

(4)異步IO(Asynchronous?IO):即經典的Proactor設計模式,也稱為異步非阻塞IO。

?

同步和異步的概念描述的是用戶線程與內核的交互方式:同步是指用戶線程發起IO請求后需要等待或者輪詢內核IO操作完成后才能繼續執行;而異步是指用戶線程發起IO請求后仍繼續執行,當內核IO操作完成后會通知用戶線程,或者調用用戶線程注冊的回調函數。

阻塞和非阻塞的概念描述的是用戶線程調用內核IO操作的方式:阻塞是指IO操作需要徹底完成后才返回到用戶空間;而非阻塞是指IO操作被調用后立即返回給用戶一個狀態值,無需等到IO操作徹底完成。

?

另外,Richard?Stevens?在《Unix?網絡編程》卷1中提到的基于信號驅動的IO(Signal?Driven?IO)模型,由于該模型并不常用,本文不作涉及。接下來,我們詳細分析四種常見的IO模型的實現原理。為了方便描述,我們統一使用IO的讀操作作為示例。

?

一、同步阻塞IO

?

同步阻塞IO模型是最簡單的IO模型,用戶線程在內核進行IO操作時被阻塞。

圖1?同步阻塞IO

如圖1所示,用戶線程通過系統調用read發起IO讀操作,由用戶空間轉到內核空間。內核等到數據包到達后,然后將接收的數據拷貝到用戶空間,完成read操作。

用戶線程使用同步阻塞IO模型的偽代碼描述為:

{

read(socket,?buffer);

process(buffer);

}

即用戶需要等待read將socket中的數據讀取到buffer后,才繼續處理接收的數據。整個IO請求的過程中,用戶線程是被阻塞的,這導致用戶在發起IO請求時,不能做任何事情,對CPU的資源利用率不夠。

?

二、同步非阻塞IO

?

同步非阻塞IO是在同步阻塞IO的基礎上,將socket設置為NONBLOCK。這樣做用戶線程可以在發起IO請求后可以立即返回。

?

圖2?同步非阻塞IO

如圖2所示,由于socket是非阻塞的方式,因此用戶線程發起IO請求時立即返回。但并未讀取到任何數據,用戶線程需要不斷地發起IO請求,直到數據到達后,才真正讀取到數據,繼續執行。

用戶線程使用同步非阻塞IO模型的偽代碼描述為:

{

while(read(socket,?buffer)?!=?SUCCESS)

;

process(buffer);

}

即用戶需要不斷地調用read,嘗試讀取socket中的數據,直到讀取成功后,才繼續處理接收的數據。整個IO請求的過程中,雖然用戶線程每次發起IO請求后可以立即返回,但是為了等到數據,仍需要不斷地輪詢、重復請求,消耗了大量的CPU的資源。一般很少直接使用這種模型,而是在其他IO模型中使用非阻塞IO這一特性。

?

三、IO多路復用

IO多路復用模型是建立在內核提供的多路分離函數select基礎之上的,使用select函數可以避免同步非阻塞IO模型中輪詢等待的問題。

圖3?多路分離函數select

如圖3所示,用戶首先將需要進行IO操作的socket添加到select中,然后阻塞等待select系統調用返回。當數據到達時,socket被激活,select函數返回。用戶線程正式發起read請求,讀取數據并繼續執行。

從流程上來看,使用select函數進行IO請求和同步阻塞模型沒有太大的區別,甚至還多了添加監視socket,以及調用select函數的額外操作,效率更差。但是,使用select以后最大的優勢是用戶可以在一個線程內同時處理多個socket的IO請求。用戶可以注冊多個socket,然后不斷地調用select讀取被激活的socket,即可達到在同一個線程內同時處理多個IO請求的目的。而在同步阻塞模型中,必須通過多線程的方式才能達到這個目的。

用戶線程使用select函數的偽代碼描述為:

{

select(socket);

while(1)?{

sockets?=?select();

for(socket?in?sockets)?{

if(can_read(socket))?{

read(socket,?buffer);

process(buffer);

}

}

}

}

其中while循環前將socket添加到select監視中,然后在while內一直調用select獲取被激活的socket,一旦socket可讀,便調用read函數將socket中的數據讀取出來。

?

然而,使用select函數的優點并不僅限于此。雖然上述方式允許單線程內處理多個IO請求,但是每個IO請求的過程還是阻塞的(在select函數上阻塞),平均時間甚至比同步阻塞IO模型還要長。如果用戶線程只注冊自己感興趣的socket或者IO請求,然后去做自己的事情,等到數據到來時再進行處理,則可以提高CPU的利用率。

IO多路復用模型使用了Reactor設計模式實現了這一機制。

圖4?Reactor設計模式

如圖4所示,EventHandler抽象類表示IO事件處理器,它擁有IO文件句柄Handle(通過get_handle獲取),以及對Handle的操作handle_event(讀/寫等)。繼承于EventHandler的子類可以對事件處理器的行為進行定制。Reactor類用于管理EventHandler(注冊、刪除等),并使用handle_events實現事件循環,不斷調用同步事件多路分離器(一般是內核)的多路分離函數select,只要某個文件句柄被激活(可讀/寫等),select就返回(阻塞),handle_events就會調用與文件句柄關聯的事件處理器的handle_event進行相關操作。

圖5?IO多路復用

如圖5所示,通過Reactor的方式,可以將用戶線程輪詢IO操作狀態的工作統一交給handle_events事件循環進行處理。用戶線程注冊事件處理器之后可以繼續執行做其他的工作(異步),而Reactor線程負責調用內核的select函數檢查socket狀態。當有socket被激活時,則通知相應的用戶線程(或執行用戶線程的回調函數),執行handle_event進行數據讀取、處理的工作。由于select函數是阻塞的,因此多路IO復用模型也被稱為異步阻塞IO模型。注意,這里的所說的阻塞是指select函數執行時線程被阻塞,而不是指socket。一般在使用IO多路復用模型時,socket都是設置為NONBLOCK的,不過這并不會產生影響,因為用戶發起IO請求時,數據已經到達了,用戶線程一定不會被阻塞。

用戶線程使用IO多路復用模型的偽代碼描述為:

void?UserEventHandler::handle_event()?{

if(can_read(socket))?{

read(socket,?buffer);

process(buffer);

}

}

?

{

Reactor.register(new?UserEventHandler(socket));

}

用戶需要重寫EventHandler的handle_event函數進行讀取數據、處理數據的工作,用戶線程只需要將自己的EventHandler注冊到Reactor即可。Reactor中handle_events事件循環的偽代碼大致如下。

Reactor::handle_events()?{

while(1)?{

sockets?=?select();

for(socket?in?sockets)?{

get_event_handler(socket).handle_event();

}

}

}

事件循環不斷地調用select獲取被激活的socket,然后根據獲取socket對應的EventHandler,執行器handle_event函數即可。

IO多路復用是最常使用的IO模型,但是其異步程度還不夠“徹底”,因為它使用了會阻塞線程的select系統調用。因此IO多路復用只能稱為異步阻塞IO,而非真正的異步IO。

?

四、異步IO

?

“真正”的異步IO需要操作系統更強的支持。在IO多路復用模型中,事件循環將文件句柄的狀態事件通知給用戶線程,由用戶線程自行讀取數據、處理數據。而在異步IO模型中,當用戶線程收到通知時,數據已經被內核讀取完畢,并放在了用戶線程指定的緩沖區內,內核在IO完成后通知用戶線程直接使用即可。

異步IO模型使用了Proactor設計模式實現了這一機制。

圖6?Proactor設計模式

如圖6,Proactor模式和Reactor模式在結構上比較相似,不過在用戶(Client)使用方式上差別較大。Reactor模式中,用戶線程通過向Reactor對象注冊感興趣的事件監聽,然后事件觸發時調用事件處理函數。而Proactor模式中,用戶線程將AsynchronousOperation(讀/寫等)、Proactor以及操作完成時的CompletionHandler注冊到AsynchronousOperationProcessor。AsynchronousOperationProcessor使用Facade模式提供了一組異步操作API(讀/寫等)供用戶使用,當用戶線程調用異步API后,便繼續執行自己的任務。AsynchronousOperationProcessor?會開啟獨立的內核線程執行異步操作,實現真正的異步。當異步IO操作完成時,AsynchronousOperationProcessor將用戶線程與AsynchronousOperation一起注冊的Proactor和CompletionHandler取出,然后將CompletionHandler與IO操作的結果數據一起轉發給Proactor,Proactor負責回調每一個異步操作的事件完成處理函數handle_event。雖然Proactor模式中每個異步操作都可以綁定一個Proactor對象,但是一般在操作系統中,Proactor被實現為Singleton模式,以便于集中化分發操作完成事件。

圖7?異步IO

如圖7所示,異步IO模型中,用戶線程直接使用內核提供的異步IO?API發起read請求,且發起后立即返回,繼續執行用戶線程代碼。不過此時用戶線程已經將調用的AsynchronousOperation和CompletionHandler注冊到內核,然后操作系統開啟獨立的內核線程去處理IO操作。當read請求的數據到達時,由內核負責讀取socket中的數據,并寫入用戶指定的緩沖區中。最后內核將read的數據和用戶線程注冊的CompletionHandler分發給內部Proactor,Proactor將IO完成的信息通知給用戶線程(一般通過調用用戶線程注冊的完成事件處理函數),完成異步IO。

用戶線程使用異步IO模型的偽代碼描述為:

void?UserCompletionHandler::handle_event(buffer)?{

process(buffer);

}

?

{

aio_read(socket,?new?UserCompletionHandler);

}

用戶需要重寫CompletionHandler的handle_event函數進行處理數據的工作,參數buffer表示Proactor已經準備好的數據,用戶線程直接調用內核提供的異步IO?API,并將重寫的CompletionHandler注冊即可。

相比于IO多路復用模型,異步IO并不十分常用,不少高性能并發服務程序使用IO多路復用模型+多線程任務處理的架構基本可以滿足需求。況且目前操作系統對異步IO的支持并非特別完善,更多的是采用IO多路復用模型模擬異步IO的方式(IO事件觸發時不直接通知用戶線程,而是將數據讀寫完畢后放到用戶指定的緩沖區中)。Java7之后已經支持了異步IO,感興趣的讀者可以嘗試使用。

本文從基本概念、工作流程和代碼示例三個層次簡要描述了常見的四種高性能IO模型的結構和原理,理清了同步、異步、阻塞、非阻塞這些容易混淆的概念。通過對高性能IO模型的理解,可以在服務端程序的開發中選擇更符合實際業務特點的IO模型,提高服務質量。希望本文對你有所幫助。

轉載于:https://www.cnblogs.com/terryguan/p/6760096.html

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/283764.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/283764.shtml
英文地址,請注明出處:http://en.pswp.cn/news/283764.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

Java線程通信的幾種方式

一、問題 有兩個線程,A 線程向一個集合里面依次添加元素“abc”字符串,一共添加十次,當添加到第五次的時候,希望 B 線程能夠收到 A 線程的通知,然后 B 線程執行相關的業務操作。線程間通信的模型有兩種:共享…

PHP個人博客項目------切切歆語博客

2019獨角獸企業重金招聘Python工程師標準>>> phpmysqlapache, ThinkPHP3.2框架開發 我的個人博客項目 適合新手練習 源碼地址下載:https://github.com/DickyQie/php-myblog 轉載于:https://my.oschina.net/zhangqie/blog/1785867

收發郵件之 MAILKIT

背景利用代碼發送郵件在工作中還是比較常見的,相信大家都用過SmtpClient來處理發送郵件的操作,不過這個類以及被標記已過時,所以介紹一個微軟推薦的庫MailKit來處理。MailKit開源地址:https://github.com/jstedfast/MailKit需要郵…

IOS_SearchBar搜索欄及關鍵字高亮

搜索框的效果演示: 這個就是所謂的搜索框了,那么接下來我們看看如何使用代碼來實現這個功能. 我所使用的數據是英雄聯盟的英雄名單,是一個JSON數據的txt文件, JSON數據的處理代碼如下所示: ?123456//獲取文件的路徑pathNSString *path [[NSBundle mainBundle] pathForResourc…

Java設計模式之(工廠模式)--簡單工廠模式--工廠方法模式--抽象工廠模式

工廠模式: 工廠模式可以分為三類: 1)簡單工廠模式(Simple Factory) 2)工廠方法模式(Factory Method) 3)抽象工廠模式(Abstract Factory) 簡單工…

今天很多 CTO 都是被干掉的,因為他沒有成就業務

作者|喬新亮 編輯|鄧艷琴 我可以絲毫不開玩笑地說,今天,很多傳統企業里的研發都只是“工人”,哪怕是 CTO,充其量也只是“高級工人”,如果不轉換思維去成就業務,就只能停留在工人級…

中航工業集團金網絡(北京)電子商務有限公司副總經理劉正珩:航空“智”造的供應鏈支撐平臺...

編者按 “十三五”時期是我國貿易發展的重要戰略機遇期,物流產業發展迅速,智慧供應鏈已經成為推動流通大國向流通強國過程中的重要行動。6月2日,由上海市國有資產監督管理委員會、上海市郵政管理局、上海市商務委員會指導,上海市國…

創建、檢查和反編譯世界上(幾乎)最短的 C# 程序

創建、檢查和反編譯世界上(幾乎)最短的 C# 程序原文來自https://www.stevejgordon.co.uk/creating-inspecting-decompiling-the-worlds-smallest-csharp-program在這篇文章中,我認為創建世界上(幾乎)最短的 C# 程序然后…

Linux下畫原理圖和PCB

Linux下畫原理圖和PCBWindows下大名鼎鼎的Allegro和經典的Protel 99SE都是不支持Linux操作系統的。做Linux驅動開發免不了要看一下原理圖和PCB。一般的做法有三種: 1.主機使用Windows系統,將Linux裝在VMWARE之類的虛擬機中這樣能夠使用Windows下的軟件看…

配置中心 App Configuration (二):Feature Flag 功能開關特性

寫在前面Web服務開發過程中我們經常有這樣的需求:某些功能我必須我修改了配置才啟用,比如新用戶注冊送券等;某個功能需到特定的時間才啟用,過后就失效,比如春節活動等;某些功能,我想先對10%的用…

oracle臨時表空間

--查看臨時表空間SELECT * FROM v$tablespace;SELECT * FROM dba_tablespaces;--查看所有臨時表空間文件SELECT * FROM dba_data_files;--查看臨時臨時表空間文件SELECT * FROM dba_temp_files;--查看臨時表空間組SELECT * FROM dba_tablespace_groups; --查找默認臨時表空間SE…

ES 2022 正式發布!有哪些新特性?

2022 年 6 月 22 日,第 123 屆 Ecma 大會批準了 ECMAScript 2022 語言規范[1],這意味著它現在正式成為標準。 1 ECMAScript 2022編輯 本次發布的編輯有: Shu-yu Guo[2] Michael Ficarra[3] Kevin Gibbons[4] 2 ECMAScript 2022有什么新內…

聯想(Lenovo)小新310經典版進bios方法

1,找到novo按鈕。 2,在關機的狀態下桶一下小孔,不用任何操作,電腦進入bios選擇界面。轉載于:https://www.cnblogs.com/senior-engineer/p/6761457.html

C#中的匿名類型

這節來講一下C#中的匿名類型。匿名類在C#中,我們可以不去顯示的聲明一個類,而是通過匿名類去臨時聲明一個類結構去幫助我們去完成一些功能。聲明一個匿名類,我們可以像下面這樣做:var Anonymousnew {name"charles",year…

MySQL之MHA高可用集群

目錄 一、MHA概述 1.1.MHA 是什么 1.2.MHA 的組成 1.3.MHA 的特點 二、MHA搭建準備 2.1.實驗思路 三、MHA搭建 3.1配置主從復制 3.2.安裝 MHA 軟件 3.3.故障模擬 3.4.故障修復 四、總結 一、MHA概述 1.1.MHA 是什么 1.MHA(MasterHigh Availability&…

Tensorflow之安裝

1.fellow the instruction of https://www.tensorflow.org/install/install_linux#installing_with_anaconda 2.anaconda安裝,修改~/.bash_profile為 export PATH~/anaconda2/bin:/usr/local/cuda/bin:$PATHexport LD_LIBRARY_PATH/usr/local/cuda/lib64:$LD_LIBRAR…

2、Saltstack的數據系統

一、Grainsgrains是salt用來收集minion端底層系統信息的接口。比如,操作系統type、域名 、IP地址、內存及其他相關系統屬性信息等。存儲在minion端,用于保存minion端數據信息。minion啟動時才加載grains信息,所以他時靜態的,Grain…

配置中心 App Configuration (一):輕松集成到Asp.Net Core

寫在前面在日常開發中,我這邊比較熟悉的配置中心有,攜程Apollo,阿里Nacos(配置中心,服務治理一體)之前文章:Asp.Net Core與攜程阿波羅(Apollo)的第一次親密接觸總體來說,Apollo和Nacos社區都比較活躍&#…

stop-hbase.sh一直處于等待狀態

今天關閉HBase時,輸入stop-hbase.sh一直處于等待狀態 解決方法: 先輸入:hbase-daemon.sh stop master 再輸入:stop-hbase.sh就可以關閉HBase集群了。 轉載于:https://www.cnblogs.com/lijinze-tsinghua/p/8667761.html

shell編程100例

1、編寫hello world腳本 #!/bin/bash# 編寫hello world腳本echo "Hello World!"2、通過位置變量創建 Linux 系統賬戶及密碼 #!/bin/bash# 通過位置變量創建 Linux 系統賬戶及密碼#$1 是執行腳本的第一個參數,$2 是執行腳本的第二個參數 useradd "$1" …