不是大神。嘗試回答一下。
首先解釋下什么叫做線程,什么叫做進程,在解釋這兩個概念前,我們還需要明白什么叫做GIL全局解釋器鎖。GIL 全局解釋器鎖: GIL(全局解釋器鎖,GIL 只有cpython有):在同一個時刻,只能有一個線程在一個cpu上執行字節碼,沒法像c和Java一樣將多個線程映射到多個CPU上執行,但是GIL會根據執行的字節碼行數(為了讓各個線程能夠平均利用CPU時間,python會計算當前已執行的微代碼數量,達到一定閾值后就強制釋放GIL)和時間片以及遇到IO操作的時候主動釋放鎖,讓其他字節碼執行。說白了GIL就是偽多線程,一個線程運行其他線程阻塞,使你的多線程代碼不是同時執行,而是交替執行。
python的多線程:由于GIL的原因,一個CPU同一個時刻只能執行一個線程,但是當遇到IO操作或者運行一定的代碼量的時候就會釋放全局解釋器鎖,執行另外一個線程。多線程能夠有效提升I/O阻塞型程序的效率;與進程相比,占用的系統資源少;線程間能夠共享資源,方便進行通信。python的多線程通過threading實現。
python的多進程:進程幾乎可以完成線程能夠完成的任何事情。與之不同的是,一個進程里面,包含一個主線程,還可以生成很多子線程。如果有需要的話,可以將它們組成多線程。多進程能夠.更好地利用多核處理器;.在處理CPU密集型任務時比多線程要好;可以通過多進程來避免全局解釋器鎖(GIL)的局限;崩潰的進程不會導致整個程序的崩潰。python中的多進程主要通過multiprocessing模塊實現。
threading實現多線程
python中提供兩個標準庫thread和threading用于對線程的支持,python3中已放棄對前者的支持,后者是一種更高層次封裝的線程庫,接下來均threading為例實現多線程。
1.創建線程
python中有兩種方式實現線程:
(1) 實例化一個threading.Thread的對象,并傳入一個初始化函數對象(initial function )作為線程執行的入口;
import threading
import time
def tstart(arg):
time.sleep(0.5)
print("%s running...." % arg)
if __name__ == '__main__':
t1 = threading.Thread(target=tstart, args=('This is thread 1',))
t2 = threading.Thread(target=tstart, args=('This is thread 2',))
t1.start()
t2.start()
t1.join()
t2.join()
print("This is main function")
(2) 繼承threading.Thread,并重寫run函數;
import threading
import time
class CustomThread(threading.Thread):
def __init__(self, thread_name):
# step 1: call base __init__ function
super(CustomThread, self).__init__(name=thread_name)
self._tname = thread_name
def run(self):
# step 2: overide run function
time.sleep(0.5)
print("This is %s running...." % self._tname)
if __name__ == "__main__":
t1 = CustomThread("thread 1")
t2 = CustomThread("thread 2")
t1.start()
t2.start()
t1.join()
t2.join()
print("This is main function")
上面兩種方法本質上都是直接或者間接使用threading.Thread類,實例化后,threading.Thread的主要方法有:start():創建線程后通過start啟動線程,等待CPU調度,為run函數執行做準備; run():線程開始執行的入口函數,函數體中會調用用戶編寫的target函數,或者執行被重載的run函數; (start() 方法是啟動一個子線程,線程名就是我們定義的name;run() 方法并不啟動一個新線程,就是在主線程中調用了一個普通函數而已。通過Thread類的start方法,可以啟動該線程,交給python虛擬機進行調度,當該線程獲得執行的機會時,就會調用run方法執行線程。) join([timeout]):阻塞掛起調用該函數的線程,直到被調用線程執行完成或超時。通常會在主線程中調用該方法,等待其他線程執行完成。 name、getName()&setName():線程名稱相關的操作; ident:整數類型的線程標識符,線程開始執行前(調用start之前)為None; isAlive()、is_alive():start函數執行之后到run函數執行完之前都為True; daemon、isDaemon()&setDaemon():守護線程相關;
2.執行多線程
前面在解釋start()和run()方法時,提到了主線程和子線程,主線程:一個進程中至少有一個線程,并作為程序的入口,這個線程就是主線程(從一開始的代碼執行到最后的打印出執行時間為主線程) 子線程:一個進程至少有一個主線程,其它線程稱為子線程; 在主線程中創建若線程之后,他們之間沒有任何協作和同步,除主線程之外每個線程都是從start()開始被執行,直到執行完畢。
上面的例子中可以發現一共有3個線程,1個主線程和2個子線程,如何定義子線程的?其實在代碼中就發現了,使用t1 = threading.Thread(target=tstart)即可生成一個子線程,然后使用t1.start()即可啟動這個子線程,這樣的話t1.jion()是不是就多余呢?其實不然,使用t1.jion()的作用就是:等待子線程執行完畢后再執行主線程,如果不加上t1.jion()的話,子線程任然執行,但是子線程再等待的時候(io操作的時候),釋放出資源,這個時候主線程拿到資源運行主線程的任務,然后再等待子線程運行結束,最后退出主程序。
所以t1.jion()放到位置很重要:
t1.start()
t1.join()
t2.start()
t2.join()
如果這樣放的話,就是先執行線程1然后等待線程1執行完畢,然后執行線程2等待線程2執行完畢。
t1.start()
t2.start()
t1.join()
t2.join()
這樣的話就不一樣,會等到線程1與線程2執行完畢后再執行主線程。
還有很多其他的線程相關的知識點,比如線程之間的優先級、通信等等。下面鏈接中的這位大神總結的非常全面,可以參考:https://blog.csdn.net/lzy98/article/details/88819425
查看我的更多相關回答:溪亭日暮:匯編 | 我的AI 技術回答?zhuanlan.zhihu.com