Linux I/O 調度方法

操作系統的調度有

CPU調度??? CPU scheduler

IO調度?????? IO scheduler

?

?

IO調度器的總體目標是希望讓磁頭能夠總是往一個方向移動,移動到底了再往反方向走,這恰恰就是現實生活中的電梯模型,所以IO調 度器也被叫做電梯. (elevator)而相應的算法也就被叫做電梯算法.

?

而Linux中IO調度的電梯算法有好幾種,

as(Anticipatory),

cfq(Complete Fairness Queueing),

deadline,

noop(No Operation).

?

具體使用哪種算法我們可以在啟動的時候通過內核參數elevator來指定.


一)I/O調度的4種算法

?

1)CFQ(完全公平排隊I/O調度程序)

特點:
在最新的內核版本和發行版中,都選擇CFQ做為默認的I/O調度器,對于通用的服務器也是最好的選擇.
CFQ試圖均勻地分布對I/O帶寬的訪問,避免進程被餓死并實現較低的延遲,是deadline和as調度器的折中.
CFQ對于多媒體應用(video,audio)和桌面系統是最好的選擇.
CFQ賦予I/O請求一個優先級,而I/O優先級請求獨立于進程優先級,高優先級的進程的讀寫不能自動地繼承高的I/O優先級.


工作原理:
CFQ為每個進程/線程,單獨創建一個隊列來管理該進程所產生的請求,也就是說每個進程一個隊列,各隊列之間的調度使用時間片來調度,
以此來保證每個進程都能被很好的分配到I/O帶寬.I/O調度器每次執行一個進程的4次請求.


2)NOOP(電梯式調度程序)

特點:
在Linux2.4或更早的版本的調度程序,那時只有這一種I/O調度算法.
NOOP實現了一個簡單的FIFO隊列,它像電梯的工作主法一樣對I/O請求進行組織,當有一個新的請求到來時,它將請求合并到最近的請求之后,以此來保證請求同一介質.
NOOP傾向餓死讀而利于寫.
NOOP對于閃存設備,RAM,嵌入式系統是最好的選擇.

電梯算法餓死讀請求的解釋:
因為寫請求比讀請求更容易.
寫請求通過文件系統cache,不需要等一次寫完成,就可以開始下一次寫操作,寫請求通過合并,堆積到I/O隊列中.
讀請求需要等到它前面所有的讀操作完成,才能進行下一次讀操作.在讀操作之間有幾毫秒時間,而寫請求在這之間就到來,餓死了后面的讀請求.

?

3)Deadline(截止時間調度程序)

特點:
通過時間以及硬盤區域進行分類,這個分類和合并要求類似于noop的調度程序.
Deadline確保了在一個截止時間內服務請求,這個截止時間是可調整的,而默認讀期限短于寫期限.這樣就防止了寫操作因為不能被讀取而餓死的現象.
Deadline對數據庫環境(ORACLE RAC,MySQL等)是最好的選擇.


4)AS(預料I/O調度程序)

特點:
本質上與Deadline一樣,但在最后一次讀操作后,要等待6ms,才能繼續進行對其它I/O請求進行調度.
可以從應用程序中預訂一個新的讀請求,改進讀操作的執行,但以一些寫操作為代價.
它會在每個6ms中插入新的I/O操作,而會將一些小寫入流合并成一個大寫入流,用寫入延時換取最大的寫入吞吐量.
AS適合于寫入較多的環境,比如文件服務器
AS對數據庫環境表現很差.

?

?

查看當前系統支持的IO調度算法
dmesg | grep -i scheduler

[root@localhost ~]# dmesg | grep -i scheduler
io scheduler noop registered
io scheduler anticipatory registered
io scheduler deadline registered
io scheduler cfq registered (default)

查看當前系統的I/O調度方法:

cat /sys/block/sda/queue/scheduler
noop anticipatory deadline [cfq]

臨地更改I/O調度方法:
例如:想更改到noop電梯調度算法:
echo noop > /sys/block/sda/queue/scheduler

想永久的更改I/O調度方法:
修改內核引導參數,加入elevator=調度程序名
vi /boot/grub/menu.lst
更改到如下內容:
kernel /boot/vmlinuz-2.6.18-8.el5 ro root=LABEL=/ elevator=deadline rhgb quiet


重啟之后,查看調度方法:
cat /sys/block/sda/queue/scheduler
noop anticipatory [deadline] cfq
已經是deadline了

?

?)I/O調度程序的測試


本次測試分為只讀,只寫,讀寫同時進行.
分別對單個文件600MB,每次讀寫2M,共讀寫300次.

?

1)測試磁盤讀:


[root@test1 tmp]# echo deadline > /sys/block/sda/queue/scheduler
[root@test1 tmp]# time dd if=/dev/sda1 of=/dev/null bs=2M count=300
300+0 records in
300+0 records out
629145600 bytes (629 MB) copied, 6.81189 seconds, 92.4 MB/s

real 0m6.833s
user 0m0.001s
sys 0m4.556s
[root@test1 tmp]# echo noop > /sys/block/sda/queue/scheduler
[root@test1 tmp]# time dd if=/dev/sda1 of=/dev/null bs=2M count=300
300+0 records in
300+0 records out
629145600 bytes (629 MB) copied, 6.61902 seconds, 95.1 MB/s

real 0m6.645s
user 0m0.002s
sys 0m4.540s
[root@test1 tmp]# echo anticipatory > /sys/block/sda/queue/scheduler
[root@test1 tmp]# time dd if=/dev/sda1 of=/dev/null bs=2M count=300
300+0 records in
300+0 records out
629145600 bytes (629 MB) copied, 8.00389 seconds, 78.6 MB/s

real 0m8.021s
user 0m0.002s
sys 0m4.586s
[root@test1 tmp]# echo cfq > /sys/block/sda/queue/scheduler
[root@test1 tmp]# time dd if=/dev/sda1 of=/dev/null bs=2M count=300
300+0 records in
300+0 records out
629145600 bytes (629 MB) copied, 29.8 seconds, 21.1 MB/s

real 0m29.826s
user 0m0.002s
sys 0m28.606s
結果:
第一 noop:用了6.61902秒,速度為95.1MB/s
第二 deadline:用了6.81189秒,速度為92.4MB/s
第三 anticipatory:用了8.00389秒,速度為78.6MB/s
第四 cfq:用了29.8秒,速度為21.1MB/s


2)測試寫磁盤:


[root@test1 tmp]# echo cfq > /sys/block/sda/queue/scheduler
[root@test1 tmp]# time dd if=/dev/zero of=/tmp/test bs=2M count=300
300+0 records in
300+0 records out
629145600 bytes (629 MB) copied, 6.93058 seconds, 90.8 MB/s

real 0m7.002s
user 0m0.001s
sys 0m3.525s
[root@test1 tmp]# echo anticipatory > /sys/block/sda/queue/scheduler
[root@test1 tmp]# time dd if=/dev/zero of=/tmp/test bs=2M count=300
300+0 records in
300+0 records out
629145600 bytes (629 MB) copied, 6.79441 seconds, 92.6 MB/s

real 0m6.964s
user 0m0.003s
sys 0m3.489s
[root@test1 tmp]# echo noop > /sys/block/sda/queue/scheduler
[root@test1 tmp]# time dd if=/dev/zero of=/tmp/test bs=2M count=300
300+0 records in
300+0 records out
629145600 bytes (629 MB) copied, 9.49418 seconds, 66.3 MB/s

real 0m9.855s
user 0m0.002s
sys 0m4.075s
[root@test1 tmp]# echo deadline > /sys/block/sda/queue/scheduler
[root@test1 tmp]# time dd if=/dev/zero of=/tmp/test bs=2M count=300
300+0 records in
300+0 records out
629145600 bytes (629 MB) copied, 6.84128 seconds, 92.0 MB/s

real 0m6.937s
user 0m0.002s
sys 0m3.447s

測試結果:
第一 anticipatory,用了6.79441秒,速度為92.6MB/s
第二 deadline,用了6.84128秒,速度為92.0MB/s
第三 cfq,用了6.93058秒,速度為90.8MB/s
第四 noop,用了9.49418秒,速度為66.3MB/s


3)測試同時讀/寫

?

[root@test1 tmp]# echo deadline > /sys/block/sda/queue/scheduler
[root@test1 tmp]# dd if=/dev/sda1 of=/tmp/test bs=2M count=300
300+0 records in
300+0 records out
629145600 bytes (629 MB) copied, 15.1331 seconds, 41.6 MB/s
[root@test1 tmp]# echo cfq > /sys/block/sda/queue/scheduler
[root@test1 tmp]# dd if=/dev/sda1 of=/tmp/test bs=2M count=300
300+0 records in
300+0 records out
629145600 bytes (629 MB) copied, 36.9544 seconds, 17.0 MB/s
[root@test1 tmp]# echo anticipatory > /sys/block/sda/queue/scheduler
[root@test1 tmp]# dd if=/dev/sda1 of=/tmp/test bs=2M count=300
300+0 records in
300+0 records out
629145600 bytes (629 MB) copied, 23.3617 seconds, 26.9 MB/s
[root@test1 tmp]# echo noop > /sys/block/sda/queue/scheduler
[root@test1 tmp]# dd if=/dev/sda1 of=/tmp/test bs=2M count=300
300+0 records in
300+0 records out
629145600 bytes (629 MB) copied, 17.508 seconds, 35.9 MB/s

測試結果:
第一 deadline,用了15.1331秒,速度為41.6MB/s
第二 noop,用了17.508秒,速度為35.9MB/s
第三 anticipatory,用了23.3617秒,速度為26.9MS/s
第四 cfq,用了36.9544秒,速度為17.0MB/s

?

三)ionice

?

ionice可以更改任務的類型和優先級,不過只有cfq調度程序可以用ionice.


有三個例子說明ionice的功能:

?

采用cfq的實時調度,優先級為7
ionice -c1 -n7 -ptime dd if=/dev/sda1 of=/tmp/test bs=2M count=300&


采用缺省的磁盤I/O調度,優先級為3
ionice -c2 -n3 -ptime dd if=/dev/sda1 of=/tmp/test bs=2M count=300&


采用空閑的磁盤調度,優先級為0
ionice -c3 -n0 -ptime dd if=/dev/sda1 of=/tmp/test bs=2M count=300&

?

ionice的三種調度方法,實時調度最高,其次是缺省的I/O調度,最后是空閑的磁盤調度.
ionice的磁盤調度優先級有8種,最高是0,最低是7.


注意,磁盤調度的優先級與進程nice的優先級沒有關系.
一個是針對進程I/O的優先級,一個是針對進程CPU的優先級.

?

Anticipatory I/O scheduler??????????????? 適用于大多數環境,但不太合適數據庫應用

Deadline I/O scheduler???????????????????? 通常與Anticipatory相當,但更簡潔小巧,更適合于數據庫應用

CFQ I/O scheduler??????????????????????????? 為所有進程分配等量的帶寬,適合于桌面多任務及多媒體應用,默認IO調度器

Default I/O scheduler

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/383415.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/383415.shtml
英文地址,請注明出處:http://en.pswp.cn/news/383415.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

編譯libcurl

1.下載源碼后,執行./buidconf產生configure配置文件 2.通過build.sh來設定configure 配置的參數 #!/bin/sh # export CFLAGS-O3 -w -isystem /home/xuxuequan/Ingenicwork/toolchain/mips-gcc472-glibc216-32bit/mips-linux-gnu/libc/usr/include export CPPFLAGS…

鏈表面試題3:將兩個有序鏈表合并為一個新的有序鏈表并返回。新鏈表是通過拼接給定的兩個鏈表的所有節點組成 的。

鏈表面試題3:將兩個有序鏈表合并為一個新的有序鏈表并返回。新鏈表是通過拼接給定的兩個鏈表的所有節點組成 的。 首先我們的思想是將得一個鏈表和第二個鏈表的每個結點進行比較,誰小誰就插入到新鏈表的最后。 首先我們要判段鏈表是否為空,…

gcc編譯參數-fPIC的一些問題

ppc_85xx-gcc -shared -fPIC liberr.c -o liberr.so-fPIC 作用于編譯階段,告訴編譯器產生與位置無關代碼(Position-Independent Code),則產生的代碼中,沒有絕對地址,全部使用相對地址,故而代碼可以被加載器加載到內存的…

雙向鏈表的操作(創建,插入,刪除)

雙向鏈表的代碼看似復雜,其實很簡單,只要畫圖便可明白, 刪除 假如要刪除的結點叫pos. pos->prev->nextpos->next; pos->next->prevpos->prev; free(pos);

我使用過的Linux命令之hwclock - 查詢和設置硬件時鐘

我使用過的Linux命令之hwclock - 查詢和設置硬件時鐘 本文鏈接:http://codingstandards.iteye.com/blog/804830 (轉載請注明出處) 用途說明 hwclock命令,與clock命令是同一個命令,主要用來查詢和設置硬件時鐘&#x…

二叉樹的操作(前,中,后序遍歷也叫深度優先遍歷,非空結點的個數)遞歸實現

定義一個二叉樹的結點 二叉樹的前序遍歷, 先訪問根結點,再訪問左,再訪問右。 每次訪問都要先看根結點是否為空,然后打印根結點,把此時根結點的左結點作為下一次遞歸的根結點,當把左結點遍歷完后&#xff0…

makefile編譯問題記錄

1.-c選項和-C選項: -c(gcc選項):編譯.c或匯編源文件,但是不作連接. 編譯器輸出對應于源文件的目標文件. 如:$(CC) -c ${CFLAGS} ${SRCS} -C(makefile選項):-C的是make…

二叉樹的相關題(葉子結點個數,最大深度,找特殊值結點(值不重復),判斷兩個樹是否相同,判斷兩個數是否為鏡像樹,是否為子樹,)

葉子結點就是沒有孩子結點,所以當當前根結點沒有孩子結點的時候,就返回1,就是找到一個葉子結點,然后訪問完每個不為空的結點就行,每次訪問都是把當前結點的左/右結點作為新的結點,來判斷。 求最大深度&…

為何線程有PID?

在linux下用 top -H -p <pid> 查詢某個進程的線程 按理說&#xff0c;都是某個進程下的線程&#xff0c; 應該進程id PID一樣啊&#xff0c;但實際卻都不一樣 實際是被PID的名字給弄混了&#xff0c;線程進程都會有自己的ID&#xff0c;這個ID就叫做PID&#xff0c;P…

關于樹和二叉樹的一些基本概念,基本名詞解釋。

二叉樹的概念 概念 一棵二叉樹是結點的一個有限集合&#xff0c;該集合或者為空&#xff0c;或者是由一個根節點加上兩棵別稱為左子樹和右子樹 的二叉樹組成。 二叉樹的特點&#xff1a; 每個結點最多有兩棵子樹&#xff0c;即二叉樹不存在度大于2的結點。二叉樹的子樹有左右…

在VI中刪除行尾的換行符

在vi中&#xff0c;如果要刪除行尾的換行符&#xff0c;可以用如下方法 第一種情況&#xff1a;只刪除單行 如有文件如下&#xff1a; [fanzfSWserver ~/tmp]$ cat names.tmp 101 Nate H. 102 John M. 104 Cassy T. 106 Mary L. 107 Isaac …

用c語言構建二叉樹(重點)

結點創建 二叉樹創建 我們以‘#’為NULL&#xff0c;我們要把輸入進來的一個字符串轉變為二叉樹&#xff0c;所以我們要記住遞歸的每一步走到數組了哪個位置 所以我們要記住創建過程中用掉的前序個數&#xff0c;并返回&#xff0c;除此之外&#xff0c;還要加上當時的那個結點…

linux 同步IO: sync msync、fsync、fdatasync與 fflush

最近閱讀leveldb源碼&#xff0c;作為一個保證可靠性的kv數據庫其數據與磁盤的交互可謂是極其關鍵&#xff0c;其中涉及到了不少內存和磁盤同步的操作和策略。為了加深理解&#xff0c;從網上整理了linux池畔同步IO相關的函數&#xff0c;這里做一個羅列和對比。大部分為copy&a…

二叉樹的廣度優先遍歷(層序遍歷)

先定義一個二叉樹的結點 再創建二叉樹&#xff0c;這里就不寫了&#xff0c;之前的有創建二叉樹的博客。 層序遍歷 用到棧的思想&#xff0c; 1 先讓根 節點進隊列&#xff0c;2 然后讀隊頂元素&#xff0c;3 讓他出隊列4 打印它的值5 讓隊頂元素的左右子樹進棧&#xff0…

用前序中序創建二叉樹(用中序后序創建二叉樹)

定義二叉樹結點 比如就拿這個二叉樹 前序中序創建 因為前序遍歷的順序是 根 &#xff0c; 左 &#xff0c;右。 中序的遍歷是 左 根 右。 我們會很不好想&#xff0c;但我們可以用前序和中序把上面那個二叉樹的遍歷一邊 前序遍歷&#xff1a;ABDEHCFG中序遍歷&#xff1a;D…

Epoll詳解及源碼分析

文章來源&#xff1a;http://blog.csdn.net/chen19870707/article/details/42525887 Author&#xff1a;Echo Chen&#xff08;陳斌&#xff09; Email&#xff1a;chenb19870707gmail.com Blog&#xff1a;Blog.csdn.net/chen19870707 Date&#xff1a;Jan.7th, 2015 1…

非遞歸實現二叉樹(前序,中序,后序)c/c++實現

這里還是用到棧的思想&#xff0c;為了方便用了c的一些內容&#xff0c;把出棧&#xff0c;進棧&#xff0c;讀棧頂元素用一個個函數封裝起來了&#xff0c;前面做了一些處理來使用這些函數。 前序非遞歸 思想&#xff1a;一直走左邊&#xff0c;依次進棧。等左邊為空的時候&…

Linux 中統計一個進程的線程數

如果你想看到 Linux 中每個進程的線程數&#xff0c;有以下幾種方法可以做到這一點。 方法一: /proc proc 偽文件系統&#xff0c;它駐留在 /proc 目錄&#xff0c;這是最簡單的方法來查看任何活動進程的線程數。 /proc 目錄以可讀文本文件形式輸出&#xff0c;提供現有進程和系…

Linux_linux基礎命令(增刪查,權限,Linux下的重要目錄,重要命令(. du, df, top, free, pstack, su, sudo).安裝gcc/g++, gdb, vim )

r&#xff1a;表示可讀w&#xff1a;表示可寫x&#xff1a;表示可執行也可以用數字表示這一點我們會在修改文件權限說明。對于文件夾的rwx表示&#xff1a;r表示可讀及可以查看文件夾內容可以ls查看w表示可寫及可以向文件夾中傳送內容如文件x表示可執行及可以向文件夾中可以cd進…

pthread_create會導致內存泄露

這幾天一直在調試一個系統&#xff0c;系統的功能就是定時發送數據、接收數據然后解析收到的數據&#xff0c;轉換成一定的格式存入數據庫中。我為了并發操作&#xff0c;所以每接收到一個數據包&#xff0c;就調用pthread_create函數創建一個默認屬性的線程進行處理。 系統…