浏览器的进程模型
现代浏览器采用不同的进程模型来提高性能和安全性,主要有以下几种:
-
单进程模型:
- 早期的浏览器,如 Internet Explorer 6,采用单进程模型。这意味着浏览器的所有功能(UI 渲染、网络请求、JavaScript 执行等)都在单个进程中运行。
- 缺点:单进程容易导致性能瓶颈,任何崩溃或卡顿都可能使整个浏览器失效。
-
多进程模型:
-
大多数现代浏览器(如 Google Chrome、Microsoft Edge、Mozilla Firefox)采用多进程模型,每个功能模块在单独的进程中运行。
-
典型的多进程模型包括:
- 浏览器进程: 主控制进程,负责管理窗口和标签页的生命周期,处理用户界面、网络请求等。
- 渲染进程: 为每个标签页或 iframe 分配独立的渲染进程,负责解析 HTML、CSS、执行 JavaScript、排版和绘制。
- GPU 进程: 负责 GPU 加速渲染处理,特别是 WebGL、Canvas 等。
- 插件进程: 处理内部或第三方插件。
- 网络进程: 管理网络请求和响应。
-
优点:提高了安全性和稳定性,一个进程崩溃不会影响其他进程。
-
什么是进程?
进程是操作系统分配资源的基本单位。一个进程包含一个或多个线程。
在浏览器上下文中:
- 独立内存空间: 每个进程拥有独立的内存空间,不同进程间的数据相互隔离。
- 资源分配: 操作系统为每个进程分配资源(如内存、CPU 时间)。
- 隔离性: 进程间的隔离提高了浏览器的安全性,因为一个进程的崩溃不会直接影响其他进程。
- 上下文切换开销: 进程之间的上下文切换相对较大,这是它的一大缺点,但是为了安全和稳定性,这个开销是值得的。
什么是线程?
有了进程后,就可以运行程序的代码了。 运行代码的「人」称之为「线程」。
线程是进程中的实际执行单位,一个进程可以包含多个线程,它们共享进程的资源和内存空间。所以在进程开启后会自动创建一个线程来运行 代码,该线程称之为主线程。 如果程序需要同时执行多块代码,主线程就会启动更多的线程来执行代 码,所以一个进程中可以包含多个线程。
在浏览器内:
- 多线程并行处理: 多个线程可以并发执行,提高处理速度和用户体验,如渲染页面的同时还能响应用户输入。
- 共享内存: 同一进程内的线程共享内存空间,可以方便地访问和修改相同的数据结构。
- 轻量级: 相较于进程,线程的创建和销毁开销较小,上下文切换更快。
浏览器有哪些进程和线程
浏览器是一个多进程多线程程序
浏览器内部工作极其复杂,为了避免相互影响,减少连环崩溃的几率,当启动浏览器后,它会自动开启多个进程。
可以在浏览器的任务管理器中查看当前所有进程
浏览器点击右上角...,点击更多工具,选择任务管理器(Chrome为例)
其中,最主要的进程有:
- 浏览器进程
主要负责界面显示、用户交互、子进程管理等。浏览器进程内部会启动多个线程处理不同的任务。 - 网络进程
负责加载网络资源。网络进程内部会启动多个线程来处理不同的网络任务。 - 渲染进程
渲染进程启动后,会开启一个渲染主线程,主线程负责执行 HTML、CSS、JS代码等。
默认情况下,浏览器会为每个标签页开启一个新的渲染进程,以保证不同的标签页之间不相互影响。
......
将来该默认模式可能会有所改变,有兴趣的同学可参见 Chrome官方说明文档
渲染主线程是如何工作的?
渲染主线程是浏览器中最繁忙的线程,需要它处理的任务包括但不限于:
- 解析 HTML 和构建 DOM 树:
- 浏览器从网络线程获取 HTML 文档,渲染引擎开始解析 HTML 内容。
- 每遇到一个 HTML 标签,创建一个对应的 DOM 节点,添加到 DOM 树中。
- 解析 CSS 和生成 CSSOM 树:
- 渲染引擎同时解析 CSS 文件和内联 CSS。
- 生成 CSSOM 树,CSSOM 代表文档的样式层次结构,它和 DOM 树一起用于渲染页面。
- 构建渲染树:
- DOM 树和 CSSOM 树合并生成渲染树(Render Tree)。
- 渲染树仅包含可见的 DOM 元素(忽略 display: none 等内容)。
- 布局(reflow):
- 渲染引擎遍历渲染树,并计算每个节点的几何位置和大小,这个过程被称为布局或 reflow。
- 布局计算需要考虑元素的布局模型、尺寸、位置等。
- 绘制(paint):
- 布局完成后,开始绘制(paint)操作,将渲染树的每个节点绘制到屏幕上。
- 绘制操作包括填充颜色、文本绘制、边框绘制、阴影等。
- 合成和光栅化:
- 独立的层(Layers)会被发送到 GPU 进行光栅化(Rasterization),生成位图(bitmap)。
- 合成线程(Compositor Thread)负责将这些位图对象合成到屏幕上,实现平滑的滚动和动画效果。
- 执行全局 JavaScript 代码:
- 渲染主线程会执行页面加载时嵌入或引用的所有全局 JavaScript 代码。
- 这些代码会在解析 HTML 和 CSS 的过程中被执行,可能会被插入到 DOM 树中。
- 执行事件处理函数:
- 当用户与页面进行交互(如点击、滚动、键盘输入等)时,相关的事件会被调度到渲染主线程来执行注册的事件处理函数。
- 事件处理可能会修改 DOM 树或触发重绘和重新布局。
- 执行计时器的回调函数:
- 浏览器中的计时器(如 setTimeout 和 setInterval)回调函数也必须在渲染主线程中执行。
- 这些回调函数可能包含额外的逻辑、DOM 操作或其他需要占用主线程资源的任务。
- 动画和绘制:
- 为了实现流畅的动画效果(通常目标是每秒 60 帧,即每帧约 16.66 毫秒),渲染主线程需要频繁地执行绘制操作。
- 这包括处理 CSS 动画、JavaScript 动画和 requestAnimationFrame 回调中的绘制逻辑。
......
思考题:为什么渲染进程不适用多个线程来处理这些事情?
要处理这么多的任务,主线程遇到了一个前所未有的难题:如何调度任务?
比如:
- 我正在执行一个 JS 函数,执行到一半的时候用户点击了按钮,我该立即 去执行点击事件的处理函数吗?
- 我正在执行一个 JS 函数,执行到一半的时候某个计时器到达了时间,我 该立即去执行它的回调吗?
- 浏览器进程通知我“用户点击了按钮”,与此同时,某个计时器也到达了时 间,我应该处理哪一个呢?
- ......
渲染主线程想出了一个绝妙的主意来处理这个问题:排队
- 在最开始的时候,渲染主线程会进入一个无限循环
- 每一次循环会检查消息队列中是否有任务存在。如果有,就取出第一个任务执行,执行完一个后进入下一次循环;如果没有,则进入休眠状态。
- 其他所有线程(包括其他进程的线程)可以随时向消息队列添加任务。新任务会加到消息队列的末尾。在添加新任务时,如果主线程是休眠状态,则会将其唤醒以继续循环拿取任务。
这样依赖,就可以让每个任务有条不紊、持续的进行下去了。
整个过程,被称之为事件循环(消息循环)
若干解释
何为异步?
代码执行过程中,会遇到一些无法立即处理的任务,比如:
- 计时完成后需要执行的任务 --
setTimeout、setInterval - 网络通信完成后需要执行的任务 --
XHR、Fetch - 用户操作后需要执行的任务 --
addEventListener
如果让渲染主线程等待这些任务的时机到达,就会导致主线程长期处于「阻塞」状态,从而导致浏览器「卡死」
渲染主线程承担着极其重要的工作,无论如何都不能阻塞!!!
因此,浏览器选择异步来解决这个问题
使用异步的方式,渲染主线程永不阻塞
如何理解JS的异步?
JS是一⻔单线程的语言,这是因为它运行在浏览器的渲染主线程中,而渲染主线程只有一个。 但渲染主线程又承担着诸多的工作,渲染⻚面、执行 JS 都在其中运行。 如果使用同步的方式,就极有可能导致主线程产生阻塞,从而导致消息队列中的很多其他任务无法得到执行。这样一来,一方面会导致繁忙的主线程白白的消耗时间,另一方面导致⻚面无法及时更新,给用户造成卡死现象。
所以浏览器采用异步的方式来避免。具体做法是当某些任务发生时,比如计时器、网络、事件监听,主线程将任务交给其他线程去处理,自身立即结束任务的执行,转而执行后续代码。当其他线程完成时,将事先传递的回调函数包装成任务,加入到消息队列的末尾排队,等待主线程调度执行。 在这种异步模式下,浏览器永不阻塞,从而最大限度的保证了单线程的流畅运行。
JS为何会阻塞渲染?
先看代码
<!DOCTYPE html>
<html lang="en">
<head>
<meta charset="UTF-8">
<meta name="viewport" content="width=device-width, initial-scale=1.0">
<title>Document</title>
</head>
<body>
<h1>hello world 今天也是开心的一天</h1>
<button>change</button>
<script>
const h1 = document.querySelector('h1');
const btn = document.querySelector('button');
// 死循环指定的时间
function delay(time) {
const start = Date.now();
while(Date.now() - start < time);
}
btn.onclick = () => {
h1.textContent = '早日暴富!'
delay(3000);
}
</script>
</body>
</html>
点击按钮后,会发现等待3秒后页面才变成早日暴富!
任务有优先级吗?
任务没有优先级,在消息队列中先进先出
但消息队列是有优先级的
根据 W3C 的最新解释:
- 每个任务都有一个任务类型,同一个类型的任务必须在一个队列,不同类型 的任务可以分属于不同的队列。 在一次事件循环中,浏览器可以根据实际情况从不同的队列中取出任务执 行。
- 浏览器必须准备好一个微队列,微队列中的任务优先所有其他任务执行 (html.spec.whatwg.org/multipage/w…)
随着浏览器的复杂度急剧提升,W3C 不再使用宏队列的说法
在目前 chrome 的实现中,至少包含了下面的队列:
- 延时队列:用于存放计时器到达后的回调任务,优先级「中」
- 交互队列:用于存放用户操作后产生的事件处理任务,优先级「高」
- 微队列:用户存放需要最快执行的任务,优先级「最高」
添加任务到微队列的主要方式主要是使用 Promise、MutationObserver
例如:Promise.resolve().then(函数)
浏览器还有很多其他的队列,由于和我们开发关系不大,不作考虑
总结:阐述一下 JS 的事件循环
事件循环又叫做消息循环,是浏览器渲染主线程的工作方式。在 Chrome 的源码中,它开启一个不会结束的 for 循环,每次循环从消息 队列中取出第一个任务执行,而其他线程只需要在合适的时候将任务加入到 队列末尾即可。
过去把消息队列简单分为宏队列和微队列,这种说法目前已无法满足复杂的 浏览器环境,取而代之的是一种更加灵活多变的处理方式。根据 W3C 官方的解释,每个任务有不同的类型,同类型的任务必须在同一 个队列,不同的任务可以属于不同的队列。不同任务队列有不同的优先级, 在一次事件循环中,由浏览器自行决定取哪一个队列的任务。但浏览器必须 有一个微队列,微队列的任务一定具有最高的优先级,必须优先调度执行。
思考:JS中的计时器能做到精确及时吗?为什么?
不行,因为:
- 计算机硬件没有原子钟,无法做到精确计时。
- 操作系统的计时函数本身就有少量偏差,由于 JS 的计时器最终调用的。 是操作系统的函数,也就携带了这些偏差。
- 按照 W3C 的标准,浏览器实现计时器时,如果嵌套层级超过 5 层, 则会带有 4 毫秒的最少时间,这样在计时时间少于 4 毫秒时又带来了偏差。
- 受事件循环的影响,计时器的回调函数只能在主线程空闲时运行,因此又带来了偏差。