從JDK 7版本開始,Java新加入的文件和網絡io特性稱為nio2(new io 2, 因為jdk1.4中已經有過一個nio了),包含了眾多性能和功能上的改進,其中最重要的部分,就是對異步io的支持,稱為Java AIO(asynchronous IO)。
因為AIO的實施需充分調用OS參與,IO需要操作系統支持、并發也同樣需要操作系統的支持,所以性能方面不同操作系統差異會比較明顯。所以本文也附帶介紹了Linux 2.6及以后版本新增的AIO特性(因為這跟Java AIO是對應關系)。
Java AIO
1基本原理
目前為止,Java共支持3種網絡編程模型:BIO、NIO、AIO:
Java BIO : 同步并阻塞,服務器實現模式為一個連接一個線程,即客戶端有連接請求時服務器端就需要啟動一個線程進行處理,如果這個連接不做任何事情會造成不必要的線程開銷,當然可以通過線程池機制改善。
Java NIO : 同步非阻塞,服務器實現模式為一個請求一個線程,即客戶端發送的連接請求都會注冊到多路復用器上,多路復用器輪詢到連接有I/O請求時才啟動一個線程進行處理。
Java AIO(NIO.2) : 異步非阻塞,服務器實現模式為一個有效請求一個線程,客戶端的I/O請求都是由OS先完成了再通知服務器應用去啟動線程進行處理。
BIO、NIO、AIO適用場景分析:
BIO方式適用于連接數目比較小且固定的架構,這種方式對服務器資源要求比較高,并發局限于應用中,JDK1.4以前的唯一選擇,但程序直觀簡單易理解。
NIO方式適用于連接數目多且連接比較短(輕操作)的架構,比如聊天服務器,并發局限于應用中,編程比較復雜,JDK1.4開始支持。
AIO方式使用于連接數目多且連接比較長(重操作)的架構,比如相冊服務器,充分調用OS參與并發操作,編程比較復雜,JDK7開始支持。
2AIO介紹
jdk在1.4版本的nio中提供了對非阻塞多路復用同步io模型的支持,但是在Windows上是基于較低效select/poll實現的。
jdk1.7中提供對aio的支持后,帶來了兩方面的好處:
Windows上可以使用iocp了。
簡化了網絡變成模型。異步io相比較非阻塞多路復用模型更易理解,開發更為簡單。
和多路復用的java nio相比較,可以發現,異步io是在數據讀取或者寫入調用已經完成的時候,再通知調用者,而非阻塞多路復用io則是在有數據就緒,可以讀寫的時候通知調用者,讀寫仍然是由調用者執行并且是阻塞的(這意味著如果要同時進行其他工作,要控制讀寫操作不能阻塞太長時間或者需要將其放去單獨的io線程執行)。
JDK7中的java aio新增的類和接口主要有:
AsynchronousServerSocketChannel ,對應于bio中的ServerSocket和nio中的ServerSocketChannel,用于server端的網絡程序。
AsynchronousSocketChannel,對云關于bio中的Socket和nio中的SocketChannel,用于client端的網絡程序。
CompletionHandler,回調接口,在socket進行accept/connect/read/write等操作時,可以傳入一個CompletionHandler的實現,操作執行完畢后,會調用注冊的CompletionHandler。
除了CompletionHandler這種回調方式,aio中還支持返回Future對象,使用Future來設定回調操作。
Linux AIO
1Linux AIO 簡介
Linux 異步 I/O 是 Linux 內核中提供的一個相當新的增強。它是 2.6 版本內核的一個標準特性,但是我們在 2.4 版本內核的補丁中也可以找到它。AIO 背后的基本思想是允許進程發起很多 I/O 操作,而不用阻塞或等待任何操作完成。稍后或在接收到 I/O 操作完成的通知時,進程就可以檢索 I/O 操作的結果。
2Linux 的 I/O 模型
在深入介紹 AIO API 之前,讓我們先來探索一下 Linux 上可以使用的不同 I/O 模型。這并不是一個詳盡的介紹,但是我們將試圖介紹最常用的一些模型來解釋它們與異步 I/O 之間的區別。圖 1 給出了同步和異步模型,以及阻塞和非阻塞的模型。
基本 Linux I/O 模型的簡單矩陣:
每個 I/O 模型都有自己的使用模式,它們對于特定的應用程序都有自己的優點。
同步阻塞 I/O:
如下圖所示:傳統的阻塞 I/O 模型,這也是目前應用程序中最為常用的一種模型。其行為非常容易理解,其用法對于典型的應用程序來說都非常有效。在調用 read 系統調用時,應用程序會阻塞并對內核進行上下文切換。然后會觸發讀操作,當響應返回時(從我們正在從中讀取的設備中返回),數據就被移動到用戶空間的緩沖區中。然后應用程序就會解除阻塞(read 調用返回)。
從應用程序的角度來說,read 調用會延續很長時間。實際上,在內核執行讀操作和其他工作時,應用程序的確會被阻塞。
同步非阻塞 I/O:
同步阻塞 I/O 的一種效率稍低的變種是同步非阻塞 I/O。在這種模型中,設備是以非阻塞的形式打開的。這意味著 I/O 操作不會立即完成,read 操作可能會返回一個錯誤代碼,說明這個命令不能立即滿足(EAGAIN 或 EWOULDBLOCK),如下圖所示。
非阻塞的實現是 I/O 命令可能并不會立即滿足,需要應用程序調用許多次來等待操作完成。這可能效率不高,因為在很多情況下,當內核執行這個命令時,應用程序必須要進行忙碌等待,直到數據可用為止,或者試圖執行其他工作。正如圖 3 所示的一樣,這個方法可以引入 I/O 操作的延時,因為數據在內核中變為可用到用戶調用 read 返回數據之間存在一定的間隔,這會導致整體數據吞吐量的降低。
異步阻塞 I/O:
另外一個阻塞解決方案是帶有阻塞通知的非阻塞 I/O。在這種模型中,配置的是非阻塞 I/O,然后使用阻塞 select 系統調用來確定一個 I/O 描述符何時有操作。使 select 調用非常有趣的是它可以用來為多個描述符提供通知,而不僅僅為一個描述符提供通知。對于每個提示符來說,我們可以請求這個描述符可以寫數據、有讀數據可用以及是否發生錯誤的通知。
select 調用的主要問題是它的效率不是非常高。盡管這是異步通知使用的一種方便模型,但是對于高性能的 I/O 操作來說不建議使用。
異步非阻塞 I/O(AIO):
最后,異步非阻塞 I/O 模型是一種處理與 I/O 重疊進行的模型。讀請求會立即返回,說明 read 請求已經成功發起了。在后臺完成讀操作時,應用程序然后會執行其他處理操作。當 read 的響應到達時,就會產生一個信號或執行一個基于線程的回調函數來完成這次 I/O 處理過程。
在一個進程中為了執行多個 I/O 請求而對計算操作和 I/O 處理進行重疊處理的能力利用了處理速度與 I/O 速度之間的差異。當一個或多個 I/O 請求掛起時,CPU 可以執行其他任務;或者更為常見的是,在發起其他 I/O 的同時對已經完成的 I/O 進行操作。
3異步 I/O(AIO) 的動機
從前面 I/O 模型的分類中,我們可以看出 AIO 的動機。這種阻塞模型需要在 I/O 操作開始時阻塞應用程序。這意味著不可能同時重疊進行處理和 I/O 操作。同步非阻塞模型允許處理和 I/O 操作重疊進行,但是這需要應用程序根據重現的規則來檢查 I/O 操作的狀態。這樣就剩下異步非阻塞 I/O 了,它允許處理和 I/O 操作重疊進行,包括 I/O 操作完成的通知。
除了需要阻塞之外,select 函數所提供的功能(異步阻塞 I/O)與 AIO 類似。不過,它是對通知事件進行阻塞,而不是對 I/O 調用進行阻塞。
總結
使用異步 I/O(AIO)可以幫助我們構建 I/O 速度更快、效率更高的應用程序。如果我們的應用程序可以對處理和 I/O 操作重疊進行,那么 AIO 就可以幫助我們構建可以更高效地使用可用 CPU 資源的應用程序。
盡管這種 I/O 模型與在大部分 Linux 應用程序中使用的傳統阻塞模式都不同,但是異步通知模型在概念上來說卻非常簡單,可以簡化我們的設計。
?
?
?
?
?
?
?
?
?
?
?
?