事件循环
浏览器的进程模型
何为进程
程序运行需要它自己的专属的内存空间 可以简单的把这块内存空间理解为进程
每个应用至少有一个进程,进程之间相互独立,即使通信 需要同意
何为线程
有了进程之后,就可以运行程序代码了
运行代码的 容器 称之为 线程
一个进程至少有一个线程 所以在进程开启后会自动创建一个线程来运行代码 该线程称之为主线程
如果程序需要同时执行多块代码,主线程就会开启更多的线程来执行代码,所以一个进程总可以包含多个线程
浏览器有哪些进程和线程
浏览器是一个多进程多线程的应用
浏览器内部工作复杂,为了避免相互影响,当启动浏览器后会自动开启多个进程(如:浏览器进程、网络进程、渲染进程)
其中主要的线程有:
- 浏览器进程
主要负责界面显示、用户交互、子进程管理、浏览器进程内部会启动多个线程处理不同的任务 - 网络进程
负责加载网络资源。网络进程内部会启动多个线程来处理不同的网络任务 - 渲染进程
渲染进程启动后,会开启一个渲染主线程,主线程负责执行HTML、css、JS代码
默认情况下,浏览器会为每个标签页开启一个新的渲染进程,以保证不同标签页之间的不相互影响
渲染主线程是如何工作的
渲染主线程是浏览器中最繁忙的线程,需要处理的任务包括但不限于
- 解析HTML、CSS
- 计算样式,布局
- 处理图层
- 执行全局JS代码
- 执行事件处理函数和一些回调函数
- ...
为什么渲染进程不使用多个线程来处理这些事情?
主线程执行的时候该 如何调度任务?
**排队**即 事件循环(event loop) 使用消息队列来处理(message queue)
- 在最开始的时候,渲染主线程会进入一个无限循环
- 每一次循环会检查消息队列中是否有任务存在,如果有就取出第一个任务执行,执行完一个后进入下一次循环如果没有则进入休眠状态
- 其他所有线程(包括其他进程的线程)可以随时向消息队列添加任务,新任务会加消息队列的末尾,在添加新任务的时,如果主状态是休眠状态,则会将其唤醒以继续循环拿任务
整个过程被称之为 事件循环 (消息循环)
一些解释
异步
代码执行的过程中会遇到一些无法立即执行的任务 比如:
- 计时完成后需要执行的任务 --
setTimeout、setInterval - 网络通信完成后需要执行的任务 --
XHR、FETCH - 用户操作后执行的任务 --
addEventListener
如果让渲染主进程等待这些任务的时机到达,就会导致主线程长期处于阻塞状态从而导致浏览器卡死
渲染主线程承担着极其重要的工作,无论如何都不能阻塞
因此浏览器选择异步来解决这个问题
使用异步的方式,渲染主线程永不会阻塞
如何理解
JS的异步?
JS是一门单线程的语言,这是因为它运行在浏览器的渲染主线程中,而渲染主线程只有一个
而渲染主线程承担着很多的工作 比如 渲染html、css执行js等
如果采用同步的方式就极有可能导致主线程产生阻塞,从而导致消息队列中的很多其他任务无法得到执行
这样一来 一方面会导致繁忙的主线程效率低,另一方面导致页面无法更新,用户体验不好
所以浏览器采用异步的方式来避免,具体做法是当某些任务发送时,比如计算器、网络请求、事件监听、主线程将任务交给其他线程去处理。自身立即结束任务的执行,转而执行后面的代码,当其他线程完成时,将事先传递的回调函数包装成任务,加入消息队列的末尾排队,等待主线程调度执行
在这种异步模式下,浏览器永不阻塞,从而最大限度的保证了单线程的流畅运行
JS为何会阻碍渲染
代码
<!DOCTYPE html>
<html lang="en">
<head>
<meta charset="UTF-8">
<meta name="viewport" content="width=device-width, initial-scale=1.0">
<title>Document</title>
</head>
<body>
<h1>Megumi</h1>
<button> CLICK ME</button>
<script>
const title = document.querySelector('h1');
const button = document.querySelector('button');
const delay = (duration) => {
const start = Date.now();
while (Date.now() - start < duration) {
// do nothing
}
}
button.addEventListener('click', event => {
title.innerHTML = 'EXPLOSION!';
delay(5000)
});
</script>
</body>
</html>
点击按钮会卡5s 后才会重新绘制
任务优先级
任务没有优先级 在消息队列中先进先出
但是消息队列是有优先级的
w3c的最新解释:
- 每一个任务都有任务类型,同一个类型的任务必须在一个队列,不同类型的任务可以分属于不同的队列,在一次事件循环中,浏览器可以根据实际情况从不同的队列中取出任务执行
- 浏览器必须准备好一个微队列,微队列中的任务优先所有其他任务执行 (
microtask queue)
随着浏览器的复杂度提升,
W3C不在使用宏队列的说法
在目前 chrom的实现中,至少包含下面的队列:
- 延时队列:用于存放计时器到达过的回调任务,优先级 中
- 交互队列:用于存放用户操作后产生的事件处理任务 优先级 高
- 微队列:用户存放需要最快执行的任务,优先级 最高
添加任务到微队列的主要方式是使用 Promise MutationObserver
例如
// 立即把一个函数添加到微队列 Promise.resolve().then(函数)
JAVASCRIPT的事件循环事件循环又叫消息循环,是浏览器渲染主线程的工作方式
在Chrome的源码中,会开启一个不会结束的for循环,每次循环从消息队列中取出第一个任务执行,而其他线程只需要在合适的时候将任务加入到队列末尾即可
过去简单的把消息队列分为宏任务和微任务 这种说法已经不能满足浏览器的复杂性 取而代之的是一种更加灵活多变的处理方式
根据 W3C 官方的解释,每个任务有不同的类型,同类型的任务必须在同一个队列,不同的任务可以属于不同的队列,不同任务队列有不同的优先级 再一次事件循环中,由浏览器自行决定那一个队列的任务。但浏览器必须有一个微队列,微队列的任务一定具有最高的优先级 必须优先调度执行
JS中的计时器能做到精确计时吗?为什么?不能,因为
- 计算机硬件没有原子钟,无法做到精确计时
- 操作系统的计时函数本身就会有偏差,JS是调用的操作系统的函数
- 按照W3C的标准,如果嵌套层级超过5层,则会有4毫秒的最少事件
- 受事件循环的影响,计时器的回调函数只能在主线程空闲的时去运行
浏览器渲染原理
渲染时间点
当浏览器的网络线程收到HTML文档后,会产生一个渲染任务,并将其传递给渲染主线程的消息队列
在事件循环机制的作用下,渲染主线程取出消息队列中的渲染任务,开启渲染流程
整个渲染的流程分为多个阶段,分别是:
HTML解析 ——> 样式计算 ——> 布局——> 分层——>绘制——>分块——>光栅化——>画
每个阶段都有明确的输入和输出,上一个阶段的输出会成为下一个阶段的输入
这样,整个渲染流程就形成了一套组织严密的生产流水线
1. 解析HTML - Parse HTML
Document Object Modal
CSS Object Modal
渲染的第一步是解析HTML
解析过程中遇到CSS解析遇到JS执行JS 为了提高解析效率,浏览器在开始解析前,会启动一个预解析的线程,率先下载HTML中的外部CSS文件和外部的JS文件
如果主线程解析到link位置,此时外部的CSS文件还没有下载解析好,主线程不会等待,继续解析后续的HTML,这是因为下载和解析CSS的工作是在预解析线程中进行的,这就是CSS不会阻塞HTML解析的根本原因
如果主线程遇到JS时必须暂停一切的任务,等待下载执行完后才能继续 解析线程可以分担一点下载JS的任务
主线程遇到script位置,会停止解析HTML,转而等待JS文件下载好,并将全局代码解析执行完成后,才继续解析HTML。这是因为JS代码的执行过程可能会修改当前的DOM树,所以DOM树的生成必须暂停,这就是JS会阻塞HTML解析的根本原因
在第一步完成后 会得到DOM树和CSSOM树 浏览器的默认样式、内部样式、外部样式、行内样式会包含在CSSOM树中
2. 计算
主线程会遍历得到的DOM树,依次为树中的每个节点计算出它的最终样式,称之为 Computed Style
在这一过程中 很多预设值会变成绝对值 比如 RED 会变成 rgb(255,0,0) 相对单位会变成绝对单位 比如 em 会变成px
这一步完成后会得到一棵带样式的DOM树
3. 布局
布局阶段会依次遍历DOM树的每一个节点,计算每一个节点的几何信息,例如节点的高度,相对包含块的位置
大部分的时候 DOM 树和布局树并非一一对应
比如display: none的节点没有几何信息 因此不会生成到布局树 又比如使用了伪元素选择器 虽然DOM树中不存在这些伪元素节点 但它们拥有几何信息 所以会生成到布局树中 还有匿名行盒 匿名快盒 等 会导致无法一一对应
4.分层
主线程会使用一套复杂的策略对整个布局树进行分层
分层的好处在于 将来某一个层改变后、仅会对该层进行后续处理 从而提高效率
滚动条 推叠上下文 transfrom opacity等样式都会影响分层的结果 可以通过will-change属性更大程序的影响分层结果
5.绘制
主线程会为每个层单独产生绘制指令集 用于描述这一层的内容该如何画出来
完成绘制之后,主线程将每个图层的绘制信息提交给合成线程,剩余的工作将由合成线程完成
6.分块
将每层分为多个小区域
分块的工作是交给多个线程同时进行的
合成线程首先对每个图层进行分块,将其划分为更多的小区域
会从线程池中拿取多个线程来完成分块工作
7.光栅化
合成线程会将信息交给GPU进程 以极高的速度完成光栅化
GPU进程会开启多个线程来完成光栅化 并且优先处理靠近视口区域的块
光栅化的结果 就是一块一块的位图
8.画
合成线程拿到每个层、每个块的位图后、生成一个个指引(quad)信息
指引会标识出每个位图应该画到屏幕的那个位置以及会考虑到旋转 缩放等变形
变形发生在合成线程 与渲染主线程无关 这就是transform高效率的本质原因
合成线程会把quad提交给GPU进程 有GPU进程产生系统调用 提交给GPU硬件 最终完成屏幕的成像
什么是reflow
reflow的本质就是重新计算layout树
当进行了会影响布局树的操作后,需要重新计算布局树 会引发layout
为了避免连续的多次操作导致布局树反复计算 浏览器会合并这些操作 当JS代码全部完成后在进行统一计算 所以改动属性造成的reflow是异步的
也同样因为如此 当JS获取布局属性时,就可能造成无法获取到最新的布局信息
决定立即获取属性立即reflow
什么是repaint
repaint的本质就是重新根据分层信息计算了绘制指令
当改动了可见样式后 就需要重新计算 会引发repaint
由于元素的布局信息也属于可见样式 所以reflow一定会引发repaint