JavaScript 運行機制
閱讀目錄
- 一、為什么JavaScript是單線程?
- 二、任務隊列
- 三、事件和回調函數
- 四、Event Loop
- 五、定時器
- 六、Node.js的Event Loop
- 七、關于setTimeout的測試
一、為什么JavaScript是單線程?
JavaScript語言是單線程,也就是說,同一個時間只能做一件事。
JavaScript的單線程,與它的用途有關。作為瀏覽器腳本語言,JavaScript的主要用途是與用戶互動,以及操作DOM。這決定了它只能是單線程,否則會帶來很復雜的同步問題。比如,假定JavaScript同時有兩個線程,一個線程在某個DOM節點上添加內容,另一個線程刪除了這個節點,這時瀏覽器應該以哪個線程為準?
所以,為了避免復雜性,從一誕生,JavaScript就是單線程,這已經成了這門語言的核心特征,將來也不會改變。
為了利用多核CPU的計算能力,HTML5提出Web Worker標準,允許JavaScript腳本創建多個線程,但是子線程完全受主線程控制,且不得操作DOM。所以,這個新標準并沒有改變JavaScript單線程的本質。
?
二、任務隊列
單線程就意味著,所有任務需要排隊,前一個任務結束,才會執行后一個任務。如果前一個任務耗時很長,后一個任務就不得不一直等著。
如果排隊是因為計算量大,CPU忙不過來,倒也算了,但是很多時候CPU是閑著的,因為IO設備(輸入輸出設備)很慢(比如Ajax操作從網絡讀取數據),不得不等著結果出來,再往下執行。
JavaScript語言的設計者意識到,這時主線程完全可以不管IO設備,掛起處于等待中的任務,先運行排在后面的任務。等到IO設備返回了結果,再回過頭,把掛起的任務繼續執行下去。
于是,所有任務可以分成兩種,一種是同步任務(synchronous),另一種是異步任務(asynchronous)。同步任務指的是,在主線程上排隊執行的任務,只有前一個任務執行完畢,才能執行后一個任務;異步任務指的是,不進入主線程、而進入"任務隊列"(task queue)的任務,只有"任務隊列"通知主線程,某個異步任務可以執行了,該任務才會進入主線程執行。
任務的執行實質上分為兩步:①.執行,②.獲取執行結果。??
具體來說,異步執行的運行機制如下。(同步執行也是如此,因為它可以被視為沒有任務隊列的異步執行。)
(1)所有同步任務都在主線程上執行,形成一個執行棧(execution context stack)。
(2)主線程之外,還存在一個"任務隊列"(taskqueue)。只要異步任務有了運行結果,就在"任務隊列"之中放置一個相應的回調函數。
(3)一旦"執行棧"中的所有同步任務執行完畢,系統就會讀取"任務隊列",看看里面有哪些事件。那些對應的異步任務,于是結束等待狀態,進入執行棧,開始執行。
(4)主線程不斷重復上面的第三步。
同步執行:執行后等待直到獲取執行結果;
異步執行:執行后不等待,而是通過一系列手段(輪詢、事件監聽和event loop等)獲取執行結果,而在執行后和獲取結果前的那段時間可以介入其他任務操作。
三、事件和回調函數
"任務隊列"是一個事件的隊列(也可以理解成消息的隊列),IO設備完成一項任務,就在"任務隊列"中添加一個事件,表示相關的異步任務可以進入"執行棧"了。主線程讀取"任務隊列",就是讀取里面有哪些事件。
"任務隊列"中的事件,除了IO設備的事件以外,還包括一些用戶產生的事件(比如鼠標點擊、頁面滾動等等)。只要指定過回調函數,這些事件發生時就會進入"任務隊列",等待主線程讀取。
所謂"回調函數"(callback),就是那些會被主線程掛起來的代碼。異步任務必須指定回調函數,當主線程開始執行異步任務,就是執行對應的回調函數。
"任務隊列"是一個先進先出的數據結構,排在前面的事件,優先被主線程讀取。主線程的讀取過程基本上是自動的,只要執行棧一清空,"任務隊列"上第一位的事件就自動進入主線程。但是,由于存在后文提到的"定時器"功能,主線程首先要檢查一下執行時間,某些事件只有到了規定的時間,才能返回主線程。
異步任務補充
onclick等:由瀏覽器內核的 DOM Binding 模塊來處理,當事件觸發的時候,回調函數會立即添加到任務隊列中。
setTimeout(setInterval):會由瀏覽器內核的 timer 模塊來進行延時處理,當時間到達的時候,才會將回調函數添加到任務隊列中。這跟之后與setImmediate執行比較有關
ajax: 會由瀏覽器內核的 network 模塊來處理,在網絡請求完成返回之后,才將回調添加到任務隊列中。
四、Event Loop
主線程運行的時候,產生堆(heap)和棧(stack),棧中的代碼調用各種外部API,它們在"任務隊列"中加入各種事件(click,load,done)。只要棧中的代碼執行完畢,主線程就會去讀取"任務隊列",依次執行那些事件所對應的回調函數。
執行棧中的代碼(同步任務),總是在讀取"任務隊列"(異步任務)之前執行。請看下面這個例子。
var req = new XMLHttpRequest();
req.open('GET', url);
req.onload = function (){};
req.onerror = function (){};
req.send();
上面代碼中的req.send方法是Ajax操作向服務器發送數據,它是一個異步任務,意味著只有當前腳本的所有代碼執行完,系統才會去讀取"任務隊列"。所以,它與下面的寫法等價。
var req = new XMLHttpRequest();
req.open('GET', url);
req.send();
req.onload = function (){};
req.onerror = function (){};
也就是說,指定回調函數的部分(onload和onerror),在send()方法的前面或后面無關緊要,因為它們屬于執行棧的一部分,系統總是執行完它們,才會去讀取"任務隊列"。
五、定時器
除了放置異步任務的事件,"任務隊列"還可以放置定時事件,即指定某些代碼在多少時間之后執行。這叫做"定時器"(timer)功能,也就是定時執行的代碼。
定時器功能主要由setTimeout()和setInterval()這兩個函數來完成,它們的內部運行機制完全一樣,區別在于前者指定的代碼是一次性執行,后者則為反復執行。以下主要討論setTimeout()。
setTimeout()接受兩個參數,第一個是回調函數,第二個是推遲執行的毫秒數。
console.log(1);
setTimeout(function(){console.log(2);},1000);
console.log(3);
上面代碼的執行結果是1,3,2;與下邊的對比
console.log(1);
setTimeout(function(){console.log(2);},0);
console.log(3);
執行結果也是1,3,2。說明setTimeout()的回調函數被掛起了,當執行棧的代碼執行完之后,才會執行。
看看下邊:
console.log(1);
setTimeout(function(){console.log(4);},0);
setTimeout(function(){console.log(2);},100);
console.log(3);
執行的結果是1,3,4,2;與下邊的對比
console.log(1);
setTimeout(function(){console.log(4);},0);
setTimeout(function(){console.log(2);},0);
console.log(3);
執行的結果還是1,3,4,2。說明任務隊列是按照先進先出的順序執行的。
HTML5標準規定了setTimeout()的第二個參數的最小值(最短間隔),不得低于4毫秒,如果低于這個值,就會自動增加。在此之前,老版本的瀏覽器都將最短間隔設為10毫秒。另外,對于那些DOM的變動(尤其是涉及頁面重新渲染的部分),通常不會立即執行,而是每16毫秒執行一次。這時使用requestAnimationFrame()的效果要好于setTimeout()。
需要注意的是,setTimeout()只是將事件插入了"任務隊列",必須等到當前代碼(執行棧)執行完,主線程才會去執行它指定的回調函數。要是當前代碼耗時很長,有可能要等很久,所以并沒有辦法保證,回調函數一定會在setTimeout()指定的時間執行。請看下面這個例子。
var startTime = new Date();
console.log(new Date().getTime());
setTimeout(function () {console.log(new Date().getTime());console.log(new Date() - startTime)
},100)
執行結果是:
1498962204851
1498962204959
160
六、Node.js的Event Loop
Node.js也是單線程的Event Loop,但是它的運行機制不同于瀏覽器環境。
請看下面的示意圖(作者@BusyRich)。
根據上圖,Node.js的運行機制如下。
(1)V8引擎解析JavaScript腳本。
(2)解析后的代碼,調用Node API。
(3)libuv庫負責Node
API的執行。它將不同的任務分配給不同的線程,形成一個Event Loop(事件循環),以異步的方式將任務的執行結果返回給V8引擎。
(4)V8引擎再將結果返回給用戶。
除了setTimeout和setInterval這兩個方法,Node.js還提供了另外兩個與"任務隊列"有關的方法:process.nextTick和setImmediate。它們可以幫助我們加深對"任務隊列"的理解。
process.nextTick方法可以在當前"執行棧"的尾部觸發回調函數。也就是說,它指定的任務總是在當前執行棧清空之后執行。setImmediate方法則是在當前"任務隊列"的尾部添加事件,也就是說,它指定的任務總是在下一次Event Loop時執行,這與setTimeout(fn, 0)很像。請看下面的例子(via?StackOverflow)。
process.nextTick(function A() {console.log(1);process.nextTick(function B(){console.log(2);});
});
setTimeout(function timeout() {console.log('TIMEOUT FIRED');
}, 0)
執行結果:
1
2
TIMEOUT FIRED
上面代碼中,由于process.nextTick方法指定的回調函數,總是在當前"執行棧"的尾部觸發,所以不僅函數A比setTimeout指定的回調函數timeout先執行,而且函數B也比timeout先執行。這說明,如果有多個process.nextTick語句(不管它們是否嵌套),將全部在當前"執行棧"執行。
現在,再看setImmediate。
setImmediate(function A() {console.log(1);setImmediate(function B(){console.log(2);});
});
setTimeout(function timeout() {console.log('TIMEOUT FIRED');
}, 0);
多次執行結果(T.T修改):
TIMEOUT FIRED
1
2
與下邊的對比:
setTimeout(function timeout() {console.log('TIMEOUT FIRED');
}, 10);
多次執行結果:
1
TIMEOUT FIRED
2
再與下邊的對比:
setTimeout(function timeout() {console.log('TIMEOUT FIRED');
}, 1000);
多次執行結果:
1
2
TIMEOUT FIRED
好像跟說的對不上。但是想想又對。結合這句話setTimeout再來看。
(T.T添加)setTimeout和setInterval的運行機制是,將指定的代碼移出本次執行,等到下一輪Event Loop前,再檢查是否到了指定時間。如果到了,就執行對應的代碼;如果不到,就等到再下一輪Event Loop時重新判斷。這意味著,setTimeout指定的代碼,必須等到本次執行的所有代碼都執行完,才會執行。
(T.T添加)每一輪Event Loop時,都會將“任務隊列”中需要執行的任務,一次執行完。setTimeout和setInterval都是把任務添加到“任務隊列”的尾部。因 此,它們實際上要等到當前腳本的所有同步任務執行完,然后再等到本次Event Loop的“任務隊列”的所有任務執行完,才會開始執行。由于前面的任務到底需要多少時間執行完,是不確定的,所以沒有辦法保證,setTimeout和 setInterval指定的任務,一定會按照預定時間執行。
(T.T添加)分析一下,timeout的執行先后跟著延時改變,
- 延時為0,第一執行,檢測到時機已到,直接執行;setImmediate要檢查棧是否清空,就比timeout慢了一拍
- 延時為10,第二執行,第一次完成檢查棧是否清空時,時間還不到10ms,然后執行輸出了1,第二次完成檢查棧是否清空,時間就已經超過10ms,即先timeout輸出,然后2
- 延時為100,第三執行,兩次完成檢查是否清空棧都在100ms之前,先輸出1,2,在執行timeout
測試setImmediate檢查延時一次約1ms--2ms。
?
由于setTimeout存在時間精度,因此setTimeout(handler,0)中setTimeout事件插入事件隊列的延時必定大于0ms,而handler的執行延時則更大了。具體為IE5~8和不插電源的IE9的時間精度為15.6ms,插電源的IE9和其他瀏覽器則為4ms。跟(五、定時器)的說法一致
七、關于setTimeout的測試
for (var i = 0; i < 5; i++) {console.log(i); }
for (var i = 0; i < 5; i++) {setTimeout(function() {console.log(i);}, 1000 * i); }
for (var i = 0; i < 5; i++) {(function(i) {setTimeout(function() {console.log(i);}, i * 1000);})(i); }
for (var i = 0; i < 5; i++) {(function() {setTimeout(function() {console.log(i);}, i * 1000);})(i); }
for (var i = 0; i < 5; i++) {setTimeout((function(i) {console.log(i);})(i), i * 1000); }
setTimeout(function() {console.log(1) }, 0); new Promise(function executor(resolve) {console.log(2);for( var i=0 ; i<10000 ; i++ ) {i == 9999 && resolve();}console.log(3); }).then(function() {console.log(4); }); console.log(5);
要多思考,不記錄了。
少原創,看了很多文章,寫了一遍之后還是有疑問就又查了資料來補充。上文有什么感覺不對的歡迎指出。感謝。
10.31補:每次回顧這篇文章,也會有一些理解偏差的,甚至是錯誤的地方,所以,多看看,多考證吧;
參考文章:
- JavaScript 運行機制詳解:深入理解Event Loop
- 一次圍繞setTimeout展開的前端面試
- 雜七雜八JS :深入理解 函數、匿名函數、自執行函數