// 1.浏览器的架构
// 架构涉及到 设计高性能Web应用 优化现有的Web应用 网络流程 页面渲染流程 js执行流程 安全Web理论
// 全文以 Chorme为代表
/**
* 1.1 进程与线程
1.1.1 并行处理
并行处理是同时处理多个任务,比如以下代码执行
A = 1 + 2
B = 10 / 2
C = 8 * 8
这几个任务 总共四个任务,前三个为任务执行, 第四个任务为展示计算结果
如果说单线程处理,分四步依次执行 如果是多线程 我们可以同时执行三个任务, 第二步 再执行第四个显示任务
并处处理性能是大大提升的 但是也有很多问题后续说
1.1.2 线程和进程
线程不是单独存在的,他是进程中的一部分,那什么是进程呢?
一个进程就是一个程序的运行实例,就是说启动一个程序,系统会为这个程序开一个内存,存放代码,运行中的数据和一个执行任务的 线程 我们把这个总体的运行环境叫做 进程
如下图
'进程线程图'
从图中看 线程依附于进程, 进程中使用多线程并行,来提升运算效率
进程和线程有4个特点,
1.进程中的任意一线程出错,都会导致整个进程的崩溃
2.线程之间共享同个进程的数据
如图'任务多线程处理图'
3.当一个进程关闭,操作系统会回收进程的内容
4.进程之间相互隔离
*1.2 单进程浏览器时代
顾名思义,单进程浏览器是指浏览器所以模块都运行再同一个进程里,这些模块包含了网络、插件、JavaScript 运行环境、渲染引擎和页面等。
如此多的功能模块运行在一个进程里,肯定有着不足的:
不稳定性
不流畅
不安全
思考题:要是面试官要你详细说的话,你该怎么去表达清楚?
*1.3多进程浏览器时代
1.3.1早期多进程的的架构图如下
'浏览器早期多进程架构'
从图中,Chrome 的页面是运行在单独的渲染进程中的,同时页面里的插件也是运行在单独的插件进程之中,而进程之间是通过 IPC 机制进行通信(如图中虚线部分)
**我们先看看如何解决不稳定的问题:**由于进程是相互隔离的,所以当一个页面或者插件崩溃时,影响到的仅仅是当前的页面进程或者插件进程,并不会影响到浏览器和其他页面,这就完美地解决了页面或者插件的崩溃会导致整个浏览器崩溃,也就是不稳定的问题。
**接下来再来看看不流畅的问题是如何解决的:**同样,JavaScript 也是运行在渲染进程中的,所以即使 JavaScript 阻塞了渲染进程,影响到的也只是当前的渲染页面,而并不会影响浏览器和其他页面,因为其他页面的脚本是运行在它们自己的渲染进程中的。所以当我们再在 Chrome 中运行上面那个死循环的脚本时,没有响应的仅仅是当前的页面。
**对于内存泄漏的解决方法那就更简单了**,因为当关闭一个页面时,整个渲染进程也会被关闭,之后该进程所占用的内存都会被系统回收,这样就轻松解决了浏览器页面的内存泄漏问题。
**最后我们再来看看上面的两个安全问题是怎么解决的**: 用多进程架构的额外好处是可以使用安全沙箱,你可以把沙箱看成是操作系统给进程上了一把锁,沙箱里面的程序可以运行,但是不能在你的硬盘上写入任何数据,也不能在敏感位置读取任何数据,例如你的文档和桌面。Chrome 把插件进程和渲染进程锁在沙箱里面,这样即使在渲染进程或者插件进程里面执行了恶意程序,恶意程序也无法突破沙箱去获取系统权限。
1.3.2 目前多进程架构
下面的才是我们的重点,目前的Chrome架构就是采用下面的方案,对于后面常见的面试题:从浏览器输入URL按回车到页面显示都发生了什么 这个经典面试题而言,有一个系统的知识体系,
如下图
'浏览器目前多进程架构'
从图中,最新的 Chrome 浏览器包括:1个浏览器(Browser)主进程、1个 GPU 进程、1个网络(NetWork)进程、多个渲染进程和多个插件进程。
下面我们来逐个分析下这几个进程的功能
1.浏览器进程。主要负责界面显示、用户交互、子进程管理,同时提供存储等功能。
2.渲染进程。核心任务是将 HTML、CSS 和 JavaScript 转换为用户可以与之交互的网页,排版引擎 Blink 和 JavaScript 引擎 V8 都是运行在该进程中,默认情况下,Chrome 会为每个 Tab 标签创建一个渲染进程。出于安全考虑,渲染进程都是运行在沙箱模式下。
3.GPU 进程。其实,Chrome 刚开始发布的时候是没有 GPU 进程的。而 GPU 的使用初衷是为了实现 3D CSS 的效果,只是随后网页、Chrome 的 UI 界面都选择采用 GPU 来绘制,这使得 GPU 成为浏览器普遍的需求。最后,Chrome 在其多进程架构上也引入了 GPU 进程。
4.网络进程。主要负责页面的网络资源加载,之前是作为一个模块运行在浏览器进程里面的,直至最近才独立出来,成为一个单独的进程。
5.插件进程。主要是负责插件的运行,因插件易崩溃,所以需要通过插件进程来隔离,以保证插件进程崩溃不会对浏览器和页面造成影响。
不过凡事都有两面性,虽然多进程模型提升了浏览器的稳定性、流畅性和安全性,但同样不可避免地带来了一些问题:
更高的资源占用因为每个进程都会包含公共基础结构的副本(如 JavaScript 运行环境),这就意味着浏览器会消耗更多的内存资源。
更复杂的体系架构浏览器各模块之间耦合性高、扩展性差等问题,会导致现在的架构已经很难适应新的需求了
*1.4 未来面向服务的架构
为了解决这些问题,在 2016 年,Chrome 官方团队使用“面向服务的架构”(Services Oriented Architecture,简称 SOA)的思想设计了新的 Chrome 架构
如图
'浏览器未来面向服务的架构'
*1.5 可能的面试题
为什么单进程浏览器当时不可以采用安全沙箱?
个人理解
如果一个进程使用了安全沙箱之后,该进程对于操作系统的权限就会受到限制,比如不能对一些位置的文件进行读写操作,而这些权限浏览器主进程所需要的,所以安全沙箱是不能应用到浏览器主进程之上的。
打开Chrome浏览器一个Tab页面,至少会出现几个进程?
最新的Chrome浏览器包括至少四个:1 个浏览器(Browser)主进程、1 个 GPU 进程、1 个网络(NetWork)进程、多个渲染进程和多个插件进程,当然还有复杂的情况;
1. 页面中有iframe的话,iframe会单独在进程中
2. 有插件的话,插件也会开启进程
3. 多个页面属于同一站点,并且从a打开b页面,会共用一个渲染进程
4. 装了扩展的话,扩展也会占用进程
这些进程都可以通过Chrome任务管理器来查看
即使如今多进程架构,还是会碰到单页面卡死的最终崩溃导致所有页面崩溃的情况,讲一讲你的理解?
提供一种情况,就是同一站点,围绕这个展开也行。
Chrome的默认策略是,每个标签对应一个渲染进程。但是如果从一个页面打开了新页面,而新页面和当前页面属于同一站点时,那么新页面会复用父页面的渲染进程。官方把这个默认策略叫process-per-site-instance。
更加简单的来说,就是如果多个页面符合同一站点,这几个页面会分配到一个渲染进程中去,所以有这样子的一种情况,一个页面崩溃了,会导致同一个站点的其他页面也奔溃,这是因为它们使用的是同一个渲染进程。
有人会问为什么会跑到一个进程里面呢?
你想一想呀,属于同一家的站点,比如下面三个:
https://time.geekbang.org
https://www.geekbang.org
https://www.geekbang.org:8080
它们在一个渲染进程中的话,它们就会共享JS执行环境,也就是A页面可以直接在B页面中执行脚本了,有些时候就是有这样子的需求嘛。
*1.6 小总结
早期浏览器:不稳定(单独进程) 不流畅(单独进程) 不安全(沙箱)
早期多进程浏览器: 主进程 渲染进程 插件进程
现代多进程架构: 主进程 渲染进程 插件进程 GPU进程 网络进程
未来面向服务架构
*/