理解浏览器进程模型以及事件循环机制

434 阅读9分钟

何为进程?

  • 每个应用至少有一个进程,进程之间相互独立,即使要通信,也需要双方同意。

image.png

何为线程?

  • 有了进程后,就可以运行程序的代码了。
  • 一个进程至少有一个线程,所以在进程开启后会自动创建一个线程来运行代码,该线程称之为主线程。
  • 如果程序需要同时执行多块代码,主线程就会启动更多的线程来执行代码,所以一个进程中可以包含多个线程。

image.png

浏览器有哪些进程和线程?

image.png

  • 可以在浏览器的任务管理器中查看当前的所有进程
  • 其中,最主要的进程有:
      1. 浏览器进程: 主要负责界面显示用户交互、子进程管理等。浏览器进程内部会启动多个线程处理不同的任务。
      1. 网络进程: 负责加载网络资源。网络进程内部会启动多个线程来处理不同的网络任务。
      1. 渲染进程:
        1. 渲染进程启动后,会开启一个渲染主线程,主线程负责执行 HTML、CSS、JS 代码。
        1. 默认情况下,浏览器会为每个标签页开启一个新的渲染进程,以保证不同的标签页之间不相互影响。

渲染主线程是如何工作的?

  • 解析HTML
  • 解析CSS
  • 计算样式(百分比转为px等)
  • 布局
  • 处理图层
  • 执行全局JS代码
  • 执行事件处理函数
  • 执行定时器回调函数
  • ...

为什么渲染进程不适用多个线程来处理这些事?

  • 要处理这么多的任务,主线程遇到了一个前所未有的难题:如何调度任务?

比如:

  • 我正在执行一个 JS 函数,执行到一半的时候用户点击了按钮,我该立即去执行点击事件的处理函数吗?
  • 我正在执行一个 JS 函数,执行到一半的时候某个计时器到达了时间,我该立即去执行它的回调吗?
  • 浏览器进程通知我“用户点击了按钮”,与此同时,某个计时器也到达了时间,我应该处理哪一个呢?
  • ......

渲染主线程想出了一个绝妙的主意来处理这个问题:排队!!!(浏览器进程不执行代码,只是把js代码拿去排队,等待渲染主线程处理)

image.png

  1. 在最开始的时候,渲染主线程会进入一个无限循环。
  2. 每一次循环会检查任务(消息)队列中是否有任务存在。如果有,就取出第一个任务执行,执行完一个后进入下一次循环;如果没有,则进入休眠状态。
  3. 其他所有线程(包括其他进程的线程)可以随时向任务(消息)队列添加任务。新任务会加到消息队列的末尾。在添加新任务时,如果主线程是休眠状态,则会将其唤醒以继续循环拿取任务。

这样一来,就可以让每个任务有条不紊的、持续的进行下去了。

何为异步?

代码在执行过程中,会遇到一些无法立即处理的任务,比如:

  • 计时完成后需要执行的任务 —— setTimeoutsetInterval
  • 网络通信完成后需要执行的任务 -- XHRFetch
  • 用户操作后需要执行的任务 -- addEventListener

如果让渲染主线程等待这些任务的时机达到,就会导致主线程长期处于「阻塞」的状态,从而导致浏览器「卡死」

image.png 渲染主线程承担着极其重要的工作,无论如何都不能阻塞! 因此,浏览器选择异步来解决这个问题。

image.png 使用异步的方式,渲染主线程永不阻塞

如何理解 JS 的异步?

  • JS是一门单线程的语言,这是因为它运行在浏览器的渲染主线程中,而渲染主线程只有一个

  • 而渲染主线程承担着诸多的工作,渲染页面、执行 JS 都在其中运行。

  • 如果使用同步的方式,就极有可能导致主线程产生阻塞,从而导致消息队列中的很多其他任务无法得到执行。这样一来,一方面会导致繁忙的主线程白白的消耗时间,另一方面导致页面无法及时更新,给用户造成卡死现象。

  • 所以浏览器采用异步的方式来避免。具体做法是当某些任务发生时,比如计时器、网络、事件监听,主线程将任务交给其他线程去处理,自身立即结束任务的执行,转而执行后续代码。当其他线程完成时,将事先传递的回调函数包装成任务,加入到消息队列的末尾排队,等待主线程调度执行

  • 在这种异步模式下,浏览器永不阻塞,从而最大限度的保证了单线程的流畅运行。

JS为何会阻碍渲染?

先看代码

<!DOCTYPE html>
<html lang="en">
<head>
  <meta charset="UTF-8">
  <meta http-equiv="X-UA-Compatible" content="IE=edge">
  <meta name="viewport" content="width=device-width, initial-scale=1.0">
  <title>Document</title>
</head>
<body>
  <h1>Mr.Z is awesome!</h1>
  <button>change</button>
  <script>
    var h1 = document.querySelector('h1');
    var btn = document.querySelector('button');
  
    // 死循环指定的时间
    function delay(duration) {
      var start = Date.now();
      while (Date.now() - start < duration) {}
    }
  
    btn.onclick = function () {
      h1.textContent = 'ZS 牛逼!';
      delay(3000);
    };
  </script>
</body>
</html>

GIF1.gif

尝试用事件循环来解释上述代码

  1. 主线程开始执行js
  2. 发现注册了点击事件,主线程告诉交互线程去监听按钮点击,点击后执行fn(使用异步的方式,渲染主线程永不阻塞),主线程执行完毕
  3. 把fn放入消息队列,主线程调度执行
  4. 改变元素文本内容为ZS 牛逼!h1.textContent = 'ZS 牛逼!'更改后, 浏览器想看到更新后的内容,需要重新渲染绘制(意味着会产生一个新的任务,要排队!),放进任务队列。
  5. 执行delay,延迟3s
  6. 主线程闲置下来,然后从消息队列里取出绘制任务
  7. 执行并展示在浏览器上

(默认情况下,js的执行会影响页面的绘制,js的执行和渲染都在浏览器的渲染主线程上)

插入

script 标签中 defer 和 async 的区别?

  • script :会阻碍 HTML 解析,只有下载好并执行完脚本才会继续解析 HTML。
  • async script :解析 HTML 过程中进行脚本的异步下载,下载成功立马执行,有可能会阻断 HTML 的解析。
  • defer script:完全不会阻碍 HTML 的解析,解析完成之后再按照顺序执行脚本。

任务有优先级吗?

1.任务没有优先级,在消息队列中先进先出

2.但消息队列是有优先级的

3.根据 W3C 的最新解释:

  • 每个任务都有一个任务类型,同一个类型的任务必须在一个队列,不同类型的任务可以分属于不同的队列。 在一次事件循环中,浏览器可以根据实际情况从不同的队列中取出任务执行。
  • 浏览器必须准备好一个微队列,微队列中的任务优先所有其他任务执行 html.spec.whatwg.org/multipage/w…

随着浏览器的复杂度急剧提升,W3C 不再使用宏队列的说法

在目前 chrome 的实现中,至少包含了下面的队列:

  • 延时队列:用于存放计时器到达后的回调任务,优先级「中」
  • 交互队列:用于存放用户操作后产生的事件处理任务,优先级「高」
  • 微队列:用户存放需要最快执行的任务,优先级「最高」

面试题

1. 阐述一下 JS 的事件循环

参考答案:

  • 事件循环又叫做消息循环,是浏览器渲染主线程的工作方式。

  • 在 Chrome 的源码中,它开启一个不会结束的 for 循环,每次循环从消息队列中取出第一个任务执行,而其他线程只需要在合适的时候将任务加入到队列末尾即可。

  • 过去把消息队列简单分为宏队列和微队列,这种说法目前已无法满足复杂的浏览器环境,取而代之的是一种更加灵活多变的处理方式。

  • 根据 W3C 官方的解释,每个任务有不同的类型,同类型的任务必须在同一个队列,不同的任务可以属于不同的队列。不同任务队列有不同的优先级,在一次事件循环中,由浏览器自行决定取哪一个队列的任务。但浏览器必须有一个微队列,微队列的任务一定具有最高的优先级,必须优先调度执行。

2. JS 中的计时器能做到精确计时吗?为什么?

参考答案:

不行,因为:

  1. 计算机硬件没有原子钟,无法做到精确计时
  2. 操作系统的计时函数本身就有少量偏差,由于 JS 的计时器最终调用的是操作系统的函数,也就携带了这些偏差
  3. 按照 W3C 的标准,浏览器实现计时器时,如果嵌套层级超过 5 层,则会带有 4 毫秒的最少时间,这样在计时时间少于 4 毫秒时又带来了偏差
  4. 受事件循环的影响,计时器的回调函数只能在主线程空闲时运行,因此又带来了偏差

3. 浏览器是如何渲染页面的?

  • 当浏览器的网络线程收到 HTML 文档后,会产生一个渲染任务,并将其传递给渲染主线程的消息队列。
  • 在事件循环机制的作用下,渲染主线程取出消息队列中的渲染任务,开启渲染流程。
  • 整个渲染流程分为多个阶段,分别是: HTML 解析、样式计算、布局、分层、绘制、分块; 每个阶段都有明确的输入输出,上一个阶段的输出会成为下一个阶段的输入。
  • 这样,整个渲染流程就形成了一套组织严密的生产流水线。 ============================================

image.png

  1. 渲染的第一步是解析 HTML
  • 解析过程中遇到 CSS 解析 CSS,遇到 JS 执行 JS。为了提高解析效率,浏览器在开始解析前,会启动一个预解析的线程,率先下载 HTML 中的外部 CSS 文件和 外部的 JS 文件。

  • 如果主线程解析到link位置,此时外部的 CSS 文件还没有下载解析好,主线程不会等待,继续解析后续的 HTML。这是因为下载和解析 CSS 的工作是在预解析线程中进行的。这就是 CSS 不会阻塞 HTML 解析的根本原因。

image.png

  • 如果主线程解析到script位置,会停止解析 HTML,转而等待 JS 文件下载好,并将全局代码解析执行完成后,才能继续解析 HTML。这是因为 JS 代码的执行过程可能会修改当前的 DOM 树,所以 DOM 树的生成必须暂停。这就是 JS 会阻塞 HTML 解析的根本原因。

  • 第一步完成后,会得到 DOM 树和 CSSOM 树,浏览器的默认样式、内部样式、外部样式、行内样式均会包含在 CSSOM 树中。

致谢:学习参考渡一教育