浏览器的渲染

149 阅读11分钟

事件循环

浏览器的进程模型

何为进程

程序运行需要它自己的专属的内存空间 可以简单的把这块内存空间理解为进程
每个应用至少有一个进程,进程之间相互独立,即使通信 需要同意

无标题-2023-10-10-1525.png

何为线程

有了进程之后,就可以运行程序代码了
运行代码的 容器 称之为 线程
一个进程至少有一个线程 所以在进程开启后会自动创建一个线程来运行代码 该线程称之为主线程
如果程序需要同时执行多块代码,主线程就会开启更多的线程来执行代码,所以一个进程总可以包含多个线程

无标题-2023-10-10-1526.png

浏览器有哪些进程和线程

浏览器是一个多进程多线程的应用

浏览器内部工作复杂,为了避免相互影响,当启动浏览器后会自动开启多个进程(如:浏览器进程、网络进程、渲染进程)

其中主要的线程有:

  1. 浏览器进程
    主要负责界面显示、用户交互、子进程管理、浏览器进程内部会启动多个线程处理不同的任务
  2. 网络进程
    负责加载网络资源。网络进程内部会启动多个线程来处理不同的网络任务
  3. 渲染进程
    渲染进程启动后,会开启一个渲染主线程,主线程负责执行 HTML、css、JS代码
    默认情况下,浏览器会为每个标签页开启一个新的渲染进程,以保证不同标签页之间的不相互影响

渲染主线程是如何工作的

渲染主线程是浏览器中最繁忙的线程,需要处理的任务包括但不限于

  • 解析HTML、CSS
  • 计算样式,布局
  • 处理图层
  • 执行全局JS代码
  • 执行事件处理函数和一些回调函数
  • ...

为什么渲染进程不使用多个线程来处理这些事情?

主线程执行的时候该 如何调度任务?

**排队**即 事件循环(event loop) 使用消息队列来处理(message queue)

aHR0cHM6Ly91cGxvYWQtaW1hZ2VzLmppYW5zaHUuaW8vdXBsb2FkX2ltYWdlcy8yMzEyNDQ4Ni1lZDUwYmY0YWI4MjBiZmE1.png

  1. 在最开始的时候,渲染主线程会进入一个无限循环
  2. 每一次循环会检查消息队列中是否有任务存在,如果有就取出第一个任务执行,执行完一个后进入下一次循环如果没有则进入休眠状态
  3. 其他所有线程(包括其他进程的线程)可以随时向消息队列添加任务,新任务会加消息队列的末尾,在添加新任务的时,如果主状态是休眠状态,则会将其唤醒以继续循环拿任务

整个过程被称之为 事件循环 (消息循环)

一些解释

异步

代码执行的过程中会遇到一些无法立即执行的任务 比如:

  • 计时完成后需要执行的任务 -- setTimeoutsetInterval
  • 网络通信完成后需要执行的任务 -- XHRFETCH
  • 用户操作后执行的任务 -- addEventListener

如果让渲染主进程等待这些任务的时机到达,就会导致主线程长期处于阻塞状态从而导致浏览器卡死

QQ截图20231010170846.png

渲染主线程承担着极其重要的工作,无论如何都不能阻塞

因此浏览器选择异步来解决这个问题

QQ截图20231010171723.png

使用异步的方式,渲染主线程永不会阻塞

如何理解JS的异步?

JS是一门单线程的语言,这是因为它运行在浏览器的渲染主线程中,而渲染主线程只有一个
而渲染主线程承担着很多的工作 比如 渲染html、css 执行js
如果采用同步的方式就极有可能导致主线程产生阻塞,从而导致消息队列中的很多其他任务无法得到执行
这样一来 一方面会导致繁忙的主线程效率低,另一方面导致页面无法更新,用户体验不好
所以浏览器采用异步的方式来避免,具体做法是当某些任务发送时,比如计算器、网络请求、事件监听、主线程将任务交给其他线程去处理。自身立即结束任务的执行,转而执行后面的代码,当其他线程完成时,将事先传递的回调函数包装成任务,加入消息队列的末尾排队,等待主线程调度执行
在这种异步模式下,浏览器永不阻塞,从而最大限度的保证了单线程的流畅运行

JS为何会阻碍渲染

代码

<!DOCTYPE html>
<html lang="en">
<head>
  <meta charset="UTF-8">
  <meta name="viewport" content="width=device-width, initial-scale=1.0">
  <title>Document</title>
</head>
<body>
  <h1>Megumi</h1>
  <button> CLICK ME</button>
  <script>
    const title = document.querySelector('h1');
    const button = document.querySelector('button');
    const delay = (duration) => {
      const start = Date.now();
      while (Date.now() - start < duration) {
        // do nothing
      }
    }
    button.addEventListener('click', event => {
      title.innerHTML = 'EXPLOSION!';
      delay(5000)
    });
  </script>
</body>
</html>

点击按钮会卡5s 后才会重新绘制

任务优先级

任务没有优先级 在消息队列中先进先出

但是消息队列是有优先级的
w3c的最新解释:

  • 每一个任务都有任务类型,同一个类型的任务必须在一个队列,不同类型的任务可以分属于不同的队列,在一次事件循环中,浏览器可以根据实际情况从不同的队列中取出任务执行
  • 浏览器必须准备好一个微队列,微队列中的任务优先所有其他任务执行 (microtask queue)

随着浏览器的复杂度提升,W3C不在使用宏队列的说法

在目前 chrom的实现中,至少包含下面的队列:

  • 延时队列:用于存放计时器到达过的回调任务,优先级 中
  • 交互队列:用于存放用户操作后产生的事件处理任务 优先级 高
  • 微队列:用户存放需要最快执行的任务,优先级 最高

添加任务到微队列的主要方式是使用 Promise MutationObserver

例如

// 立即把一个函数添加到微队列
Promise.resolve().then(函数)

JAVASCRIPT的事件循环

事件循环又叫消息循环,是浏览器渲染主线程的工作方式
Chrome的源码中,会开启一个不会结束的for循环,每次循环从消息队列中取出第一个任务执行,而其他线程只需要在合适的时候将任务加入到队列末尾即可
过去简单的把消息队列分为宏任务和微任务 这种说法已经不能满足浏览器的复杂性 取而代之的是一种更加灵活多变的处理方式
根据 W3C 官方的解释,每个任务有不同的类型,同类型的任务必须在同一个队列,不同的任务可以属于不同的队列,不同任务队列有不同的优先级 再一次事件循环中,由浏览器自行决定那一个队列的任务。但浏览器必须有一个微队列,微队列的任务一定具有最高的优先级 必须优先调度执行

JS中的计时器能做到精确计时吗?为什么?

不能,因为

  • 计算机硬件没有原子钟,无法做到精确计时
  • 操作系统的计时函数本身就会有偏差,JS是调用的操作系统的函数
  • 按照W3C的标准,如果嵌套层级超过5层,则会有4毫秒的最少事件
  • 受事件循环的影响,计时器的回调函数只能在主线程空闲的时去运行

浏览器渲染原理

渲染时间点

QQ图片20231011013113.png

当浏览器的网络线程收到HTML文档后,会产生一个渲染任务,并将其传递给渲染主线程的消息队列
在事件循环机制的作用下,渲染主线程取出消息队列中的渲染任务,开启渲染流程

整个渲染的流程分为多个阶段,分别是:
HTML解析 ——> 样式计算 ——> 布局——> 分层——>绘制——>分块——>光栅化——>

每个阶段都有明确的输入和输出,上一个阶段的输出会成为下一个阶段的输入
这样,整个渲染流程就形成了一套组织严密的生产流水线

1. 解析HTML - Parse HTML

QQ截图20231011123631.png

Document Object Modal QQ截图20231011135831.png

CSS Object Modal image-20231011145715252.png

渲染的第一步是解析HTML

解析过程中遇到CSS解析遇到JS执行JS 为了提高解析效率,浏览器在开始解析前,会启动一个预解析的线程,率先下载HTML中的外部CSS文件和外部的JS文件

如果主线程解析到link位置,此时外部的CSS文件还没有下载解析好,主线程不会等待,继续解析后续的HTML,这是因为下载和解析CSS的工作是在预解析线程中进行的,这就是CSS不会阻塞HTML解析的根本原因

QQ截图20231011172315.png 如果主线程遇到JS时必须暂停一切的任务,等待下载执行完后才能继续 解析线程可以分担一点下载JS的任务

QQ截图20231011172733.png

主线程遇到script位置,会停止解析HTML,转而等待JS文件下载好,并将全局代码解析执行完成后,才继续解析HTML。这是因为JS代码的执行过程可能会修改当前的DOM树,所以DOM树的生成必须暂停,这就是JS会阻塞HTML解析的根本原因

在第一步完成后 会得到DOM树和CSSOM树 浏览器的默认样式、内部样式、外部样式、行内样式会包含在CSSOM树中

2. 计算

主线程会遍历得到的DOM树,依次为树中的每个节点计算出它的最终样式,称之为 Computed Style

在这一过程中 很多预设值会变成绝对值 比如 RED 会变成 rgb(255,0,0) 相对单位会变成绝对单位 比如 em 会变成px

QQ截图20231011174216.png

这一步完成后会得到一棵带样式的DOM树

3. 布局

布局阶段会依次遍历DOM树的每一个节点,计算每一个节点的几何信息,例如节点的高度,相对包含块的位置

大部分的时候 DOM 树和布局树并非一一对应

比如display: none的节点没有几何信息 因此不会生成到布局树 又比如使用了伪元素选择器 虽然DOM树中不存在这些伪元素节点 但它们拥有几何信息 所以会生成到布局树中 还有匿名行盒 匿名快盒 等 会导致无法一一对应

4.分层

主线程会使用一套复杂的策略对整个布局树进行分层

分层的好处在于 将来某一个层改变后、仅会对该层进行后续处理 从而提高效率

滚动条 推叠上下文 transfrom opacity等样式都会影响分层的结果 可以通过will-change属性更大程序的影响分层结果

5.绘制

主线程会为每个层单独产生绘制指令集 用于描述这一层的内容该如何画出来
完成绘制之后,主线程将每个图层的绘制信息提交给合成线程,剩余的工作将由合成线程完成

QQ截图20231014105900.png

6.分块

将每层分为多个小区域
分块的工作是交给多个线程同时进行的
合成线程首先对每个图层进行分块,将其划分为更多的小区域
会从线程池中拿取多个线程来完成分块工作 whiteboard_exported_image.png

7.光栅化

whiteboard_exported_image (1).png 合成线程会将信息交给GPU进程 以极高的速度完成光栅化
GPU进程会开启多个线程来完成光栅化 并且优先处理靠近视口区域的块
光栅化的结果 就是一块一块的位图

8.画

whiteboard_exported_image (3).png 合成线程拿到每个层、每个块的位图后、生成一个个指引(quad)信息
指引会标识出每个位图应该画到屏幕的那个位置以及会考虑到旋转 缩放等变形
变形发生在合成线程 与渲染主线程无关 这就是transform高效率的本质原因
合成线程会把quad提交给GPU进程 有GPU进程产生系统调用 提交给GPU硬件 最终完成屏幕的成像

什么是reflow

reflow的本质就是重新计算layout树
当进行了会影响布局树的操作后,需要重新计算布局树 会引发layout
为了避免连续的多次操作导致布局树反复计算 浏览器会合并这些操作 当JS代码全部完成后在进行统一计算 所以改动属性造成的reflow是异步的
也同样因为如此 当JS获取布局属性时,就可能造成无法获取到最新的布局信息
决定立即获取属性立即reflow

什么是repaint

repaint的本质就是重新根据分层信息计算了绘制指令
当改动了可见样式后 就需要重新计算 会引发repaint
由于元素的布局信息也属于可见样式 所以reflow一定会引发repaint