一 Chrome 架构

230 阅读5分钟

一 进程与线程

进程是程序的运行实例。启动一个程序,操作系统会为该程序创建一个内存区域,用来存放代码、运行中的数据、和一个执行任务的主线程,这样的运行环境就是进程。

线程依附于进程,由进程来启动和管理,用来执行任务。一个进程中可以有多个线程,可以并行处理任务,提高执行效率。

进程与线程间的三个特点:

  1. 进程中的任意一个线程出错,会导致整个进程的崩溃。
  2. 线程之间共享进程中的数据。
  3. 当一个进程关闭之后,操作系统会回收进程所占用的内存。
  4. 进程之间的内容相互隔离(通过IPC可以实现进程间通信)。

二 单进程时代

早期的浏览器,所有功能模块都运行在同一个进程里。包括网络、插件、Javascript 运行环境、渲染引擎和页面等。如此多的模块运行在一个进程里,产生三大问题。

single (2).jpg

2.1 不稳定

外部插件和渲染引擎模块,都很不稳定,任意一个崩溃将导致整个浏览器的崩溃。

2.2 不流畅

从上面的图可以看出来,所有的页面渲染模块、javascript 执行环境及插件都是运行在一个线程中的,同一时刻只能运行这其中的一个模块。由此会产生任务阻塞、卡顿甚至崩溃。

单进程中内存存在不能完全回收的可能,导致内存占用越来越高,会使浏览器变慢,乃至崩溃。

2.3 不安全

进程内的数据可以共享,使得一些外部插件可以获取到操作系统的任意资源。

三 早期多进程架构

早期多进程架构.png

3.1 针对单进程时代弊端的处理

Debug 1:不稳定

进程之间相互隔离,当一个页面或者插件崩溃时,影响到的仅仅是当前页面的进程或者插件进程,并不会影响到浏览器和其他页面,这就解决了一处崩溃导致整个浏览器崩溃的问题。

Debug 2: 不流畅

每个页面都有自己独立的渲染进程,所以当某个页面发生阻塞时,不会影响其他的页面。关闭一个页面时,整个渲染进程也会被关闭,该进程所占用的内存都会被系统回收,不存在内存泄漏的问题。

Debug 3:不安全

Chrome 把插件进程和渲染进程锁在沙箱里面,这样即使在渲染进程或者插件进程里面执行了恶意程序,恶意程序也无法突破沙箱去获取系统数据。

3.2 渲染进程

Chrome 默认的策略是,每个标签页一个渲染进程。

但是如果从一个页面打开新的页面,而新页面与当前页属于同一站点时,那么新页面和父页面会使用同一渲染进程,因为它们需要共享 Javascript 的执行环境(比如A页面可以直接在B页面中执行脚本)。这时,一个页面崩溃,会导致其他同一站点的页面也崩溃。

iframe(非同一站点) 运行在单独的进程中。

同一站点示例:根域名(example.com)和协议(https://)相同,包含了该根域名下的所有子域名和不同的端口

https://time.example.com
https://www.example.com
https://www.example.com:8080

3.3 沙箱说明

可以把沙箱看成是操作系统给进程上了一把锁,沙箱里面的程序可以运行,但是不能在硬盘上写入任何数据,也不能在敏感位置读取任何数据,例如你的文档和桌面。

四 当前多进程架构

当前多进程架构.png

4.1 各进程作用

  1. 浏览器主进程:主要负责界面显示、用户交互、子进程管理,同时提供存储等功能。

  2. 渲染进程:核心任务是将 HTML、CSS 和 Javascript 转换为可以与之交互的网页,排版引擎 Blink 和 JavaScript 引擎 V8 都是运行在该进程中,默认情况下,Chrome 会为每个 Tab 标签创建一个渲染进程。出于安全考虑,渲染进程都是运行在沙箱模式下。

  3. GPU进程:绘制 3D 动画效果,渲染绘制 UI。

  4. 网络进程:负责网络资源加载。

  5. 插件进程:插件的运行。

4.2 不足

  1. 更高的资源占用。
  2. 更复杂的体系架构,各模块间耦合性高、扩展性差等。

五 面向服务的多架构(SOA)

面向服务多架构.png

Chrome 整体架构朝向现代操作系统所采用的“面向服务的架构” 方向发展。

原来的各种模块会被重构成独立的服务(Service),每个服务都可以在独立的进程中运行,访问服务必须使用定义好的接口,通过 IPC 来通信,从而构建一个更内聚、松耦合、易于维护和扩展的系统,更好实现 Chrome 简单、稳定、高速、安全的目标。

最终要把 UI、数据库、文件、设备、网络等模块重构为基础服务,类似操作系统底层服务。


思考题:Chrome 打开一个页面开启了几个进程?


[参考]:李冰《浏览器工作原理与实践》