一 进程与线程
进程是程序的运行实例。启动一个程序,操作系统会为该程序创建一个内存区域,用来存放代码、运行中的数据、和一个执行任务的主线程,这样的运行环境就是进程。
线程依附于进程,由进程来启动和管理,用来执行任务。一个进程中可以有多个线程,可以并行处理任务,提高执行效率。
进程与线程间的三个特点:
- 进程中的任意一个线程出错,会导致整个进程的崩溃。
- 线程之间共享进程中的数据。
- 当一个进程关闭之后,操作系统会回收进程所占用的内存。
- 进程之间的内容相互隔离(通过IPC可以实现进程间通信)。
二 单进程时代
早期的浏览器,所有功能模块都运行在同一个进程里。包括网络、插件、Javascript 运行环境、渲染引擎和页面等。如此多的模块运行在一个进程里,产生三大问题。
2.1 不稳定
外部插件和渲染引擎模块,都很不稳定,任意一个崩溃将导致整个浏览器的崩溃。
2.2 不流畅
从上面的图可以看出来,所有的页面渲染模块、javascript 执行环境及插件都是运行在一个线程中的,同一时刻只能运行这其中的一个模块。由此会产生任务阻塞、卡顿甚至崩溃。
单进程中内存存在不能完全回收的可能,导致内存占用越来越高,会使浏览器变慢,乃至崩溃。
2.3 不安全
进程内的数据可以共享,使得一些外部插件可以获取到操作系统的任意资源。
三 早期多进程架构
3.1 针对单进程时代弊端的处理
Debug 1:不稳定
进程之间相互隔离,当一个页面或者插件崩溃时,影响到的仅仅是当前页面的进程或者插件进程,并不会影响到浏览器和其他页面,这就解决了一处崩溃导致整个浏览器崩溃的问题。
Debug 2: 不流畅
每个页面都有自己独立的渲染进程,所以当某个页面发生阻塞时,不会影响其他的页面。关闭一个页面时,整个渲染进程也会被关闭,该进程所占用的内存都会被系统回收,不存在内存泄漏的问题。
Debug 3:不安全
Chrome 把插件进程和渲染进程锁在沙箱里面,这样即使在渲染进程或者插件进程里面执行了恶意程序,恶意程序也无法突破沙箱去获取系统数据。
3.2 渲染进程
Chrome 默认的策略是,每个标签页一个渲染进程。
但是如果从一个页面打开新的页面,而新页面与当前页属于同一站点时,那么新页面和父页面会使用同一渲染进程,因为它们需要共享 Javascript 的执行环境(比如A页面可以直接在B页面中执行脚本)。这时,一个页面崩溃,会导致其他同一站点的页面也崩溃。
iframe(非同一站点) 运行在单独的进程中。
同一站点示例:根域名(example.com)和协议(https://)相同,包含了该根域名下的所有子域名和不同的端口
https://time.example.com
https://www.example.com
https://www.example.com:8080
3.3 沙箱说明
可以把沙箱看成是操作系统给进程上了一把锁,沙箱里面的程序可以运行,但是不能在硬盘上写入任何数据,也不能在敏感位置读取任何数据,例如你的文档和桌面。
四 当前多进程架构
4.1 各进程作用
-
浏览器主进程:主要负责界面显示、用户交互、子进程管理,同时提供存储等功能。
-
渲染进程:核心任务是将 HTML、CSS 和 Javascript 转换为可以与之交互的网页,排版引擎 Blink 和 JavaScript 引擎 V8 都是运行在该进程中,默认情况下,Chrome 会为每个 Tab 标签创建一个渲染进程。出于安全考虑,渲染进程都是运行在沙箱模式下。
-
GPU进程:绘制 3D 动画效果,渲染绘制 UI。
-
网络进程:负责网络资源加载。
-
插件进程:插件的运行。
4.2 不足
- 更高的资源占用。
- 更复杂的体系架构,各模块间耦合性高、扩展性差等。
五 面向服务的多架构(SOA)
Chrome 整体架构朝向现代操作系统所采用的“面向服务的架构” 方向发展。
原来的各种模块会被重构成独立的服务(Service),每个服务都可以在独立的进程中运行,访问服务必须使用定义好的接口,通过 IPC 来通信,从而构建一个更内聚、松耦合、易于维护和扩展的系统,更好实现 Chrome 简单、稳定、高速、安全的目标。
最终要把 UI、数据库、文件、设备、网络等模块重构为基础服务,类似操作系统底层服务。
思考题:Chrome 打开一个页面开启了几个进程?
[参考]:李冰《浏览器工作原理与实践》