一、浏览器进程模型
1. 何为进程
进程是操作系统资源分配的最小单元
程序运行需要有它自己专属的内存空间,可以把这块内存空间简单理解为进程
每个应用至少有一个进程,进程之间相互独立,即使要通信,也需要双方同意。
2. 何为线程
线程是操作系统能够进行运算调度的最小单元,是进程中实际运行的单位。
有了进程之后,就可以运行程序的代码了,运行代码的「人」称之为「线程」。一个进程至少有一个线程,所以在进程开启后会自动创建一个线程来运行代码,该线程称之为主线程。
如果程序需要同时执行多块代码,主线程就会启动更多的线程来执行代码,所以一个进程中可以包含多个线程。
3. 浏览器有哪些进程和线程
浏览器是一个多进程多线程的应用程序,浏览器内部工作极其复杂。
为了避免相互影响,为了减少连环崩溃的几率,当启动浏览器后,它会自动启动多个进程。
其中,最主要的进程有:
-
浏览器进程
主要负责界面显示、用户交互、子进程管理等,浏览器进程内部会启动多个线程处理不同的任务。
-
网络进程
负责加载网络资源。网络进程内部会启动多个线程来处理不同的网络任务。
-
渲染进程
渲染进程启动后,会开启一个渲染主线程,主线程负责执行 HTML、CSS、JS 代码。
默认情况下,浏览器会为每个标签页开启一个新的渲染进程,以保证不同的标签页之间不相互影响。
3. 渲染主线程是如何工作的
渲染主线程是浏览器中最繁忙的线程,需要它处理的任务包括但不限于:
- 解析 HTML
- 解析 CSS
- 计算样式
- 布局
- 处理图层
- 每秒把页面画 60 次
- 执行全局 JS 代码
- 执行事件处理函数
- 执行计时器的回调函数
- ......
思考题:为什么渲染进程不适用多个线程来处理这些事情?
要处理这么多的任务,主线程遇到了一个前所未有的难题:如何调度任务?
比如:
- 我正在执行一个 JS 函数,执行到一半的时候用户点击了按钮,我该立即去执行点击事件的处理函数吗?
- 我正在执行一个 JS 函数,执行到一半的时候某个计时器到达了时间,我该立即去执行它的回调吗?
- 浏览器进程通知我“用户点击了按钮”,与此同时,某个计时器也到达了时间,我应该处理哪一个呢?
- ......
渲染主线程想出了一个绝妙的主意来处理这个问题:排队
- 在最开始的时候,渲染主线程会进入一个无限循环
- 每一次循环会检查消息队列中是否有任务存在。如果有,就取出第一个任务执行,执行完一个后进入下一次循环;如果没有,则进入休眠状态。
- 其他所有线程(包括其他进程的线程)可以随时向消息队列添加任务。新任务会加到消息队列的末尾。在添加新任务时,如果主线程是休眠状态,则会将其唤醒以继续循环拿取任务
这样一来,可以让每个任务有条不紊的、持续的进行下去了,整个过程,被称之为事件循环。
通常,我们编写的 HTML、CSS、JavaScript 等文件,经过浏览器运行之后就会显示出页面,那他们是如何转化为页面的?这背后的原理是什么?这个过程就是浏览器的渲染进程来操作实现的。浏览器的渲染进程的主要任务就是将静态资源转化为可视化界面,下面我们来探讨这个过程是怎么实现的,以及具体的细节!
二、浏览器渲染原理
1. 什么是渲染
浏览器中的 “渲染” 指的是将 HTML 字符串转化为屏幕上的像素信息的过程。
我们可以将渲染想象成一个 render 函数,函数接收一个 html 字符串,将其经过一系列处理得出若干像素点的颜色,将这些像素信息存在 pixels 变量中返回。
function render(html) {
// 一系列处理得出像素信息...
return pixels;
}
2. 渲染时间点
了解什么是渲染之后,我们不由得好奇发问:渲染是在什么时候发生的呢?
当我们在浏览器键入一个 URL 时,网络线程会通过网络通信拿到 HTML,但网络线程自身并不会处理 HTML,它会将其生成一个渲染任务交给消息队列,在合适的时机渲染主线程会从消息队列中取出渲染任务执行,启动渲染的流程。
3. 渲染流水线
接下来我们重点来讲解渲染的流程,整个过程如下图:
3.1 解析HTML
由于字符串难以进行操作,浏览器首先会将 HTML 字符串解析成 DOM 树和 CSSOM 树这种容易操作的对象结构,也提供了 js 操作这两棵树的能力。
HTML 解析过程遇到 CSS 和 JS 怎么办?
为了提高解析效率,浏览器在开始解析前,会启动一个预解析的线程,率先下载 HTML 中的外部 CSS 文件和 外部的 JS 文件。
如果主线程解析到 link 位置,此时外部的 CSS 文件还没有下载解析好,主线程不会等待,继续解析后续的 HTML,这是因为下载和解析 CSS 的工作是在预解析线程中进行的,这就是 CSS 不会阻塞 HTML 解析的根本原因。
如果主线程解析到 script 位置,会停止解析 HTML,转而等待 JS 文件下载好,并将全局代码解析执行完成后,才能继续解析 HTML,这是因为 JS 代码的执行过程可能会修改当前的 DOM 树,所以 DOM 树的生成必须暂停,这就是 JS 会阻塞 HTML 解析的根本原因。
3.2 样式计算
经过 HTML 解析过后,我们拿到了 DOM 树和 CSSOM 树,但是光得到这两颗树还不够,还需要知道每个DOM对应哪些样式。
主线程会遍历得到的 DOM 树,依次为树中的每个节点计算出它最终的样式,称之为 Computed Style。
在这一过程中,很多预设值会变成绝对值,比如 red 会变成 rgb(255,0,0);相对单位会变成绝对单位,比如 em 会变成 px,这一步完成后,会得到一棵带有样式的 DOM 树。
3.3 布局
布局阶段会依次遍历 DOM 树的每一个节点,计算每个节点的几何信息,例如节点的宽高、相对包含块的位置。
大部分时候,DOM 树和布局树并非一一对应:比如 display:none 的节点没有几何信息,因此不会生成到布局树;又比如使用了伪元素选择器,虽然 DOM 树中不存在这些伪元素节点,但它们拥有几何信息,所以会生成到布局树中;还有匿名行盒、匿名块盒等等都会导致 DOM 树和布局树无法一一对应。
3.4 分层
经过布局,每个元素的位置和大小就有了,那下面是不是就该开始绘制页面了?答案是否定的,因为页面上可能有很多复杂的场景,比如3D变化、页面滚动、使用z-index进行z轴的排序等。所以,为了实现这些效果,渲染引擎还需要为特定的节点生成专用的图层,并生成一棵对应的图层树。
那什么是图层呢?相我们可以在 Chrome 浏览器的开发者工具中,选择 Layers 标签,就可以看到页面的分层情况,以掘金首页为例,其分层情况如下:
可以看到,渲染引擎给页面分了很多图层,这些图层会按照一定顺序叠加在一起,就形成了最终的页面。这里,将页面分解成多个图层的操作就成为分层, 最后将这些图层合并到一层的操作就成为合成, 分层和合成通常是一起使用的。Chrome 引入了分层和合成的机制就是为了提升每帧的渲染效率。
分层的好处在于,将来某一个层改变后,仅会对该层进行后续处理,从而提升效率,滚动条、堆叠上下文、transform、opacity 等样式都会或多或少的影响分层结果。
3.5 绘制
主线程会为每个层单独产生绘制指令集,用于描述这一层的内容该如何画出来。
什么是绘制指令集?
类似于:
将笔移动到(10,30)的位置 画一个 20 * 30 的矩形 将矩形填充为红色 ...
渲染引擎在绘制图层时,会把一个图层的绘制分成很多绘制指令,然后把这些指令按照顺序组成一个待绘制的列表:
可以看到,绘制列表中的指令就是一系列的绘制操作。通常情况下,绘制一个元素需要执行多条绘制指令,因为每个元素的背景、边框等属性都需要单独的指令进行绘制,所以在图层绘制阶段,输出的内容就是绘制列表。
在 Chrome 浏览器的开发者工具中,通过 Layer 标签可以看到图层的绘制列表和绘制过程: 绘制列表只是用来记录绘制顺序和绘制指令的列表,而绘制操作是由渲染引擎中的合成线程来完成的。当图层绘制列表准备好之后,主线程会把该绘制列表提交给合成线程。
3.6 分块
合成线程首先对每个图层进行分块,将其划分为更多的小区域,它会从线程池中拿取多个线程来完成分块工作。
3.7 光栅化
光栅化是将每个块变成位图,位图可以理解成内存里的一个二维数组,这个二维数组记录了每个像素点信息。
合成线程会将块信息交给 GPU 进程,以极高的速度完成光栅化。
GPU 进程会开启多个线程来完成光栅化,并且优先处理靠近视口区域的块。
光栅化的结果,就是一块一块的位图。
3.8 画
最后一个阶段就是画了
合成线程拿到每个层、每个块的位图后,生成一个个「指引(quad)」信息
指引会标识出每个位图应该画到屏幕的哪个位置,以及会考虑到旋转、缩放等变形
变形发生在合成线程,与渲染主线程无关,这就是 transform 效率高的本质原因
合成线程会把 quad 提交给 GPU 进程,由 GPU 进程产生系统调用,提交给 GPU 硬件,完成最终的屏幕成像