Linux內核線程kernel thread詳解--Linux進程的管理與調度

內核線程


為什么需要內核線程


Linux內核可以看作一個服務進程(管理軟硬件資源,響應用戶進程的種種合理以及不合理的請求)。

內核需要多個執行流并行,為了防止可能的阻塞,支持多線程是必要的。

內核線程就是內核的分身,一個分身可以處理一件特定事情。內核線程的調度由內核負責,一個內核線程處于阻塞狀態時不影響其他的內核線程,因為其是調度的基本單位。

這與用戶線程是不一樣的。因為內核線程只運行在內核態

因此,它只能使用大于PAGE_OFFSET(傳統的x86_32上是3G)的地址空間。

內核線程概述


內核線程是直接由內核本身啟動的進程。內核線程實際上是將內核函數委托給獨立的進程,它與內核中的其他進程”并行”執行。內核線程經常被稱之為內核守護進程

他們執行下列任務

  • 周期性地將修改的內存頁與頁來源塊設備同步

  • 如果內存頁很少使用,則寫入交換區

  • 管理延時動作, 如2號進程接手內核進程的創建

  • 實現文件系統的事務日志

內核線程主要有兩種類型

  1. 線程啟動后一直等待,直至內核請求線程執行某一特定操作。

  2. 線程啟動后按周期性間隔運行,檢測特定資源的使用,在用量超出或低于預置的限制時采取行動。

內核線程由內核自身生成,其特點在于

  1. 它們在CPU的管態執行,而不是用戶態。

  2. 它們只可以訪問虛擬地址空間的內核部分(高于TASK_SIZE的所有地址),但不能訪問用戶空間

內核線程的進程描述符task_struct


task_struct進程描述符中包含兩個跟進程地址空間相關的字段mm, active_mm,

struct task_struct
{// ...struct mm_struct *mm;struct mm_struct *avtive_mm;//...
};
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7

大多數計算機上系統的全部虛擬地址空間分為兩個部分: 供用戶態程序訪問的虛擬地址空間和供內核訪問的內核空間。每當內核執行上下文切換時, 虛擬地址空間的用戶層部分都會切換, 以便當前運行的進程匹配, 而內核空間不會放生切換。

對于普通用戶進程來說,mm指向虛擬地址空間的用戶空間部分,而對于內核線程,mm為NULL。

這位優化提供了一些余地, 可遵循所謂的惰性TLB處理(lazy TLB handing)。active_mm主要用于優化,由于內核線程不與任何特定的用戶層進程相關,內核并不需要倒換虛擬地址空間的用戶層部分,保留舊設置即可。由于內核線程之前可能是任何用戶層進程在執行,故用戶空間部分的內容本質上是隨機的,內核線程決不能修改其內容,故將mm設置為NULL,同時如果切換出去的是用戶進程,內核將原來進程的mm存放在新內核線程的active_mm中,因為某些時候內核必須知道用戶空間當前包含了什么。

為什么沒有mm指針的進程稱為惰性TLB進程?

假如內核線程之后運行的進程與之前是同一個, 在這種情況下, 內核并不需要修改用戶空間地址表。地址轉換后備緩沖器(即TLB)中的信息仍然有效。只有在內核線程之后, 執行的進程是與此前不同的用戶層進程時, 才需要切換(并對應清除TLB數據)。

內核線程和普通的進程間的區別在于內核線程沒有獨立的地址空間,mm指針被設置為NULL;它只在 內核空間運行,從來不切換到用戶空間去;并且和普通進程一樣,可以被調度,也可以被搶占。

內核線程的創建


創建內核線程接口的演變


內核線程可以通過兩種方式實現:

  • 古老的接口 kernel_create和daemonize

    將一個函數傳遞給kernel_thread創建并初始化一個task,該函數接下來負責幫助內核調用daemonize已轉換為內核守護進程,daemonize隨后完成一些列操作, 如該函數釋放其父進程的所有資源,不然這些資源會一直鎖定直到線程結束。阻塞信號的接收, 將init用作守護進程的父進程

  • 更加現在的方法kthead_create和kthread_run

    創建內核更常用的方法是輔助函數kthread_create,該函數創建一個新的內核線程。最初線程是停止的,需要使用wake_up_process啟動它。

    使用kthread_run,與kthread_create不同的是,其創建新線程后立即喚醒它,其本質就是先用kthread_create創建一個內核線程,然后通過wake_up_process喚醒它

2號進程kthreadd的誕生


早期的kernel_create和daemonize接口

在早期的內核中, 提供了kernel_create和daemonize接口, 但是這種機制操作復雜而且將所有的任務交給內核去完成。

但是這種機制低效而且繁瑣, 將所有的操作塞給內核, 我們創建內核線程的初衷不本來就是為了內核分擔工作, 減少內核的開銷的么

Workqueue機制

因此在linux-2.6以后, 提供了更加方便的接口kthead_create和kthread_run, 同時將內核線程的創建操作延后, 交給一個工作隊列workqueue, 參見http://lxr.linux.no/linux+v2.6.13/kernel/kthread.c#L21,

Linux中的workqueue機制就是為了簡化內核線程的創建。通過kthread_create并不真正創建內核線程, 而是將創建工作create work插入到工作隊列helper_wq中, 隨后調用workqueue的接口就能創建內核線程。并且可以根據當前系統CPU的個數創建線程的數量,使得線程處理的事務能夠并行化。workqueue是內核中實現簡單而有效的機制,他顯然簡化了內核daemon的創建,方便了用戶的編程.

工作隊列(workqueue)是另外一種將工作推后執行的形式.工作隊列可以把工作推后,交由一個內核線程去執行,也就是說,這個下半部分可以在進程上下文中執行。最重要的就是工作隊列允許被重新調度甚至是睡眠。

具體的信息, 請參見

Linux workqueue工作原理

2號進程kthreadd

但是這種方法依然看起來不夠優美, 我們何不把這種創建內核線程的工作交給一個特殊的內核線程來做呢?

于是linux-2.6.22引入了kthreadd進程, 并隨后演變為2號進程, 它在系統初始化時同1號進程一起被創建(當然肯定是通過kernel_thread),?參見rest_init函數, 并隨后演變為創建內核線程的真正建造師,?參見kthreadd和kthreadd函數, 它會循環的是查詢工作鏈表static LIST_HEAD(kthread_create_list);中是否有需要被創建的內核線程, 而我們的通過kthread_create執行的操作, 只是在內核線程任務隊列kthread_create_list中增加了一個create任務, 然后會喚醒kthreadd進程來執行真正的創建操作?

內核線程會出現在系統進程列表中, 但是在ps的輸出中進程名command由方括號包圍, 以便與普通進程區分。

如下圖所示, 我們可以看到系統中, 所有內核線程都用[]標識, 而且這些進程父進程id均是2, 而2號進程kthreadd的父進程是0號進程

使用ps -eo pid,ppid,command

ps查看內核線程

kernel_thread


kernel_thread是最基礎的創建內核線程的接口, 它通過將一個函數直接傳遞給內核來創建一個進程, 創建的進程運行在內核空間, 并且與其他進程線程共享內核虛擬地址空間

kernel_thread的實現經歷過很多變革?
早期的kernel_thread執行更底層的操作, 直接創建了task_struct并進行初始化,

引入了kthread_create和kthreadd 2號進程后, kernel_thread的實現也由統一的_do_fork(或者早期的do_fork)托管實現

早期實現

早期的內核中, kernel_thread并不是使用統一的do_fork或者_do_fork這一封裝好的接口實現的, 而是使用更底層的細節

參見

http://lxr.free-electrons.com/source/kernel/fork.c?v=2.4.37#L613

我們可以看到它內部調用了更加底層的arch_kernel_thread創建了一個線程

arch_kernel_thread

其具體實現請參見

http://lxr.free-electrons.com/ident?v=2.4.37;i=arch_kernel_thread

但是這種方式創建的線程并不適合運行,因此內核提供了daemonize函數, 其聲明在include/linux/sched.h中

//  http://lxr.free-electrons.com/source/include/linux/sched.h?v=2.4.37#L800
extern void daemonize(void);
  • 1
  • 2

定義在kernel/sched.c

http://lxr.free-electrons.com/source/kernel/sched.c?v=2.4.37#L1326

主要執行如下操作

  1. 該函數釋放其父進程的所有資源,不然這些資源會一直鎖定直到線程結束。

  2. 阻塞信號的接收

  3. 將init用作守護進程的父進程

我們可以看到早期內核的很多地方使用了這個接口, 比如

可以參見

http://lxr.free-electrons.com/ident?v=2.4.37;i=daemonize

我們將了這么多kernel_thread, 但是我們并不提倡我們使用它, 因為這個是底層的創建內核線程的操作接口, 使用kernel_thread在內核中執行大量的操作, 雖然創建的代價已經很小了, 但是對于追求性能的linux內核來說還不能忍受

因此我們只能說kernel_thread是一個古老的接口, 內核中的有些地方仍然在使用該方法, 將一個函數直接傳遞給內核來創建內核線程

新版本的實現

于是linux-3.x下之后, 有了更好的實現, 那就是


延后內核的創建工作, 將內核線程的創建工作交給一個內核線程來做, 即kthreadd 2號進程

但是在kthreadd還沒創建之前, 我們只能通過kernel_thread這種方式去創建,?

同時kernel_thread的實現也改為由_do_fork(早期內核中是do_fork)來實現, 參見kernel/fork.c

pid_t kernel_thread(int (*fn)(void *), void *arg, unsigned long flags)
{return _do_fork(flags|CLONE_VM|CLONE_UNTRACED, (unsigned long)fn,(unsigned long)arg, NULL, NULL, 0);
}
  • 1
  • 2
  • 3
  • 4
  • 5

kthread_create


struct task_struct *kthread_create_on_node(int (*threadfn)(void *data),void *data,int node,const char namefmt[], ...);#define kthread_create(threadfn, data, namefmt, arg...) \kthread_create_on_node(threadfn, data, NUMA_NO_NODE, namefmt, ##arg)
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7

創建內核更常用的方法是輔助函數kthread_create,該函數創建一個新的內核線程。最初線程是停止的,需要使用wake_up_process啟動它。

kthread_run


/*** kthread_run - create and wake a thread.* @threadfn: the function to run until signal_pending(current).* @data: data ptr for @threadfn.* @namefmt: printf-style name for the thread.** Description: Convenient wrapper for kthread_create() followed by* wake_up_process().  Returns the kthread or ERR_PTR(-ENOMEM).*/
#define kthread_run(threadfn, data, namefmt, ...)                          \
({                                                                         \struct task_struct *__k                                            \= kthread_create(threadfn, data, namefmt, ## __VA_ARGS__); \if (!IS_ERR(__k))                                                  \wake_up_process(__k);                                      \__k;                                                               \
})
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18

使用kthread_run,與kthread_create不同的是,其創建新線程后立即喚醒它,其本質就是先用kthread_create創建一個內核線程,然后通過wake_up_process喚醒它

內核線程的退出


線程一旦啟動起來后,會一直運行,除非該線程主動調用do_exit函數,或者其他的進程調用kthread_stop函數,結束線程的運行。

    int kthread_stop(struct task_struct *thread);
  • 1

kthread_stop() 通過發送信號給線程。

如果線程函數正在處理一個非常重要的任務,它不會被中斷的。當然如果線程函數永遠不返回并且不檢查信號,它將永遠都不會停止。

在執行kthread_stop的時候,目標線程必須沒有退出,否則會Oops。原因很容易理解,當目標線程退出的時候,其對應的task結構也變得無效,kthread_stop引用該無效task結構就會出錯。

為了避免這種情況,需要確保線程沒有退出,其方法如代碼中所示:

thread_func()
{// do your work here// wait to exitwhile(!thread_could_stop()){wait();}
}exit_code()
{kthread_stop(_task);   //發信號給task,通知其可以退出了
}
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14

這種退出機制很溫和,一切盡在thread_func()的掌控之中,線程在退出時可以從容地釋放資源,而不是莫名其妙地被人“暗殺”。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/385012.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/385012.shtml
英文地址,請注明出處:http://en.pswp.cn/news/385012.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

可變參數函數(二)

函數樣例&#xff1a; #include<stdio.h> #include<stdlib.h> #include<stdarg.h>double add(int n,...) {int i 0;double sum 0;va_list argptr;va_start(argptr,n);for(i 0 ; i < n; i){double d va_arg(argptr,double);printf("%d argument …

Linux 內核網絡協議棧 ------sk_buff 結構體 以及 完全解釋 (2.6.16)

在2.6.24之后這個結構體有了較大的變化&#xff0c;此處先說一說2.6.16版本的sk_buff&#xff0c;以及解釋一些問題。一、先直觀的看一下這個結構體~~~~~~~~~~~~~~~~~~~~~~在下面解釋每個字段的意義~~~~~~~~~~~[cpp] view plaincopyprint?struct sk_buff { /* These…

可變參數輸出(三)

Linux C關于輸出函數的定義&#xff1a; int printf(const char *format,…); int vprintf(const char * format,va_list ap); int vfprintf(FILE *stream,cosnt char *format,va_list ap); int vsprintf(char *str,const char *format,va_list ap); int vsnprintf(char *str,s…

最常用的設計模式---適配器模式(C++實現)

適配器模式屬于結構型的設計模式&#xff0c;它是結構型設計模式之首&#xff08;用的最多的結構型設計模式&#xff09;。 適配器設計模式也并不復雜&#xff0c;適配器它是主要作用是將一個類的接口轉換成客戶希望的另外一個接口這樣使得原本由于接口不兼容而不能一起工作的那…

Linux 簡單打印日志(二)

#include<stdio.h> #include<stdlib.h> #include<string.h> #include<time.h> //#include<windows.h> #include <unistd.h> // linux下頭文件#define FILE_MAX_SIZE (1024*1024)void get_local_time(char* buffer){time_t rawtime;struct …

程序隨筆——C++實現的一個線程池

1.線程池簡介 我們知道在線程池是一種多線程處理形式&#xff0c;處理過程中我們將相應的任務提交給線程池&#xff0c;線程池會分配對應的工作線程執行任務或存放在任務隊列中&#xff0c;等待執行。 面向對象編程中&#xff0c;創建和銷毀對象是需要消耗一定時間的&#xff0…

線程池原理及創建并C++實現

本文給出了一個通用的線程池框架&#xff0c;該框架將與線程執行相關的任務進行了高層次的抽象&#xff0c;使之與具體的執行任務無關。另外該線程池具有動態伸縮性&#xff0c;它能根據執行任務的輕重自動調整線程池中線程的數量。文章的最后&#xff0c;我們給出一個簡單示例…

Linux 打印簡單日志(一)

簡單日志輸出&#xff1a; #include<stdio.h> #include<string.h> #include<stdlib.h>void write(char* filename,char* szStr){FILE* fp;fp fopen(filename,"at");if(fp ! NULL){fwrite(szStr,256,1,fp); //fclose(fp);fp NULL;} }int main(int…

c++簡單線程池實現

線程池&#xff0c;簡單來說就是有一堆已經創建好的線程&#xff08;最大數目一定&#xff09;&#xff0c;初始時他們都處于空閑狀態&#xff0c;當有新的任務進來&#xff0c;從線程池中取出一個空閑的線程處理任務&#xff0c;然后當任務處理完成之后&#xff0c;該線程被重…

Linux 打印可變參數日志

實現了傳輸進去的字符串所在的文檔&#xff0c;函數和行數顯示功能。 實現了將傳入的可變參數打印到日志功能。 #include<stdio.h> #include<stdarg.h> #include<string.h>const char * g_path "/home/exbot/wangqinghe/log.txt"; #define LOG(fm…

C++強化之路之線程池開發整體框架(二)

一.線程池開發框架 我所開發的線程池由以下幾部分組成&#xff1a; 1.工作中的線程。也就是線程池中的線程&#xff0c;主要是執行分發來的task。 2.管理線程池的監督線程。這個線程的創建獨立于線程池的創建&#xff0c;按照既定的管理方法進行管理線程池中的所有線程&#xf…

vfprintf()函數

函數聲明&#xff1a;int vfprintf(FILE *stream, const char *format, va_list arg) 函數參數&#xff1a; stream—這是指向了FILE對象的指針&#xff0c;該FILE對象標識了流。 format—c語言字符串&#xff0c;包含了要被寫入到流stream中的文本。它可以包含嵌入的format標簽…

Makefile(二)

將生產的.o文件放進指定的文件中&#xff08;先創建該文件夾&#xff09; src $(wildcard ./*.cpp) obj $(patsubst %.cpp,./output/%.o,$(src))target test$(target) : $(obj)g $(obj) -o $(target) %.o: %.cppg -c $< -o output/$.PHONY:clean clean:rm -f $(target) $…

TCP粘包問題分析和解決(全)

TCP通信粘包問題分析和解決&#xff08;全&#xff09;在socket網絡程序中&#xff0c;TCP和UDP分別是面向連接和非面向連接的。因此TCP的socket編程&#xff0c;收發兩端&#xff08;客戶端和服務器端&#xff09;都要有成對的socket&#xff0c;因此&#xff0c;發送端為了將…

UML類圖符號 各種關系說明以及舉例

UML中描述對象和類之間相互關系的方式包括&#xff1a;依賴&#xff0c;關聯&#xff0c;聚合&#xff0c;組合&#xff0c;泛化&#xff0c;實現等。表示關系的強弱&#xff1a;組合>聚合>關聯>依賴 相互間關系 聚合是表明對象之間的整體與部分關系的關聯&#xff0c…

尋找數組中第二大數

設置兩個數值來表示最大數和第二大數&#xff0c;在循環比較賦值即可 //找給定數組中第二大的數int get_smax(int *arr,int length) {int max;int smax;if(arr[0] > arr[1]){max arr[0];smax arr[1];}else{max arr[1];smax arr[0];}for(int i 2; i < length; i){if(…

timerfd API使用總結

timerfd 介紹 timerfd 是在Linux內核2.6.25版本中添加的接口&#xff0c;其是Linux為用戶提供的一個定時器接口。這個接口基于文件描述符&#xff0c;所以可以被用于select/poll/epoll的場景。當使用timerfd API創建多個定時器任務并置于poll中進行事件監聽&#xff0c;當沒有可…

#if/#else/#endif

在linux環境下寫c代碼時會嘗試各種方法或調整路徑&#xff0c;需要用到#if #include<stdio.h>int main(){int i; #if 0i 1; #elsei 2; #endifprintf("i %d",i);return 0; } 有時候會調整代碼&#xff0c;但是又不是最終版本的更換某些值&#xff0c;就需要注…

內存分配調用

通過函數給實參分配內存&#xff0c;可以通過二級指針實現 #include<stdio.h> #incldue<stdlib.h>void getheap(int *p) //錯誤的模型 {p malloc(100); }void getheap(int **p) //正確的模型 {*p malloc(100); } int main() {int *p NULL;getheap(&p);free(p…

ESP傳輸模式拆解包流程

一、 ESP簡介ESP&#xff0c;封裝安全載荷協議(Encapsulating SecurityPayloads)&#xff0c;是一種Ipsec協議&#xff0c;用于對IP協議在傳輸過程中進行數據完整性度量、來源認證、加密以及防回放攻擊。可以單獨使用&#xff0c;也可以和AH一起使用。在ESP頭部之前的IPV4…