浏览器的运行机制

129 阅读10分钟

@[TOC]

1、浏览器是多进程的

最后下面的渲染进程可能有多个(每个tab页面浏览器都会启动一个渲染进程)

Browser进程:

浏览器的主进程(负责协调、主控),只有一个。

负责浏览器界面显示,与用户交互。如前进,后退等

负责各个页面的管理,创建和销毁其他进程

将Renderer进程得到的内存中的Bitmap,绘制到用户界面上

网络资源的管理,下载等

第三方插件进程:

每种类型的插件对应一个进程,仅当使用该插件时才创建

GPU进程:

最多一个,用于3D绘制等

浏览器渲染进程(浏览器内核)(Renderer进程,内部是多线程的):

默认每个Tab页面都会产生一个渲染进程,互不影响。主要作用为

页面渲染,脚本执行,事件处理等

怎么查看浏览器进程情况

打开Chrome Shift+Esc;我们可以看到进程情况,Chrome图标就是Browser主进程

多线程优缺点

避免单个page crash影响整个浏览器

避免第三方插件crash影响整个浏览器

多进程充分利用多核优势

方便使用沙盒模型隔离插件等进程,提高浏览器稳定性

简单点理解:如果浏览器是单进程,那么某个Tab页崩溃了,就影响了整个浏览器,体验有多差;同理如果是单进程,插件崩溃了也会影响整个浏览器;而且多进程还有其它的诸多优势,当然内存等资源消耗也会更大

重点是浏览器内核(渲染进程)该进程有多个线程完成

GUI渲染线程

负责渲染浏览器界面,解析HTML,CSS,构建DOM树和RenderObject树,布局和绘制等。

当界面需要重绘(Repaint)或由于某种操作引发回流(reflow)时,该线程就会执行

注意,GUI渲染线程与JS引擎线程是互斥的,当JS引擎执行时GUI线程会被挂起(相当于被冻结了),GUI更新会被保存在一个队列中等到JS引擎空闲时立即被执行

为什么互斥:由于 JS 是可以操作 DOM 的,如果同时修改元素属性并同时渲染界面(即 JS线程和UI线程同时运行), 那么渲染线程前后获得的元素就可能不一致了(简单说就是js修改dom后没有重新渲染成功)

JS引擎线程

也称为JS内核,负责处理Javascript脚本程序。(例如V8引擎)

JS引擎线程负责解析Javascript脚本,运行代码。

JS引擎一直等待着任务队列中任务的到来,然后加以处理,一个Tab页(renderer进程)中无论什么时候都只有一个JS线程在运行JS程序

同样注意,GUI渲染线程与JS引擎线程是互斥的,所以如果JS执行的时间过长,这样就会造成页面的渲染不连贯,导致页面渲染加载阻塞。

事件触发线程

归属于浏览器而不是JS引擎,用来控制事件循环(可以理解,JS引擎自己都忙不过来,需要浏览器另开线程协助)

当JS引擎执行代码块如setTimeOut时(也可来自浏览器内核的其他线程,如鼠标点击、AJAX异步请求等),会将对应任务添加到事件线程中

当对应的事件符合触发条件被触发时,该线程会把事件添加到待处理队列的队尾,等待JS引擎的处理

注意,由于JS的单线程关系,所以这些待处理队列中的事件都得排队等待JS引擎处理(当JS引擎空闲时才会去执行)

定时触发器线程

传说中的setInterval与setTimeout所在线程

浏览器定时计数器并不是由JavaScript引擎计数的,(因为JavaScript引擎是单线程的, 如果处于阻塞线程状态就会影响记计时的准确)

因此通过单独线程来计时并触发定时(计时完毕后,添加到事件队列中,等待JS引擎空闲后执行)

注意,W3C在HTML标准中规定,规定要求setTimeout中低于4ms的时间间隔算为4ms。

异步http请求线程

在XMLHttpRequest在连接后是通过浏览器新开一个线程请求

将检测到状态变更时,如果设置有回调函数,异步线程就产生状态变更事件,将这个回调再放入事件队列中。再由JavaScript引擎执行。

进程间的通信过程

  1. Browser进程收到用户请求,首先需要获取页面内容(譬如通过网络下载资源),随后将该任务通过RendererHost接口传递给Render进程

  2. Renderer进程的Renderer接口收到消息,简单解释后,交给渲染线程,然后开始渲染

  3. 渲染线程接收请求,加载网页并渲染网页,这其中可能需要Browser进程获取资源和需要GPU进程来帮助渲染

  4. 当然可能会有JS线程操作DOM(这样可能会造成回流并重绘)

  5. 最后Render进程将结果传递给Browser进程

  6. Browser进程接到结果并将结果绘制出来

渲染进程(浏览器内核)线程的关系

GUI渲染线程与JS引擎线程互斥

由于JavaScript是可操纵DOM的,如果在修改这些元素属性同时渲染界面(即JS线程和UI线程同时运行),那么渲染线程前后获得的元素数据就可能不一致了。

因此为了防止渲染出现不可预期的结果,浏览器设置GUI渲染线程与JS引擎为互斥的关系,当JS引擎执行时GUI线程会被挂起,

GUI更新则会被保存在一个队列中等到JS引擎线程空闲时立即被执行。

JS阻塞页面加载

从上述的互斥关系,可以推导出,JS如果执行时间过长就会阻塞页面。

譬如,假设JS引擎正在进行巨量的计算,此时就算GUI有更新,也会被保存到队列中,等待JS引擎空闲后执行。

然后,由于巨量计算,所以JS引擎很可能很久很久后才能空闲,自然会感觉到巨卡无比。

所以,要尽量避免JS执行时间过长,这样就会造成页面的渲染不连贯,导致页面渲染加载阻塞的感觉。

WebWorker,JS的多线程

JavaScript引擎是单线程运行的,JavaScript中耗时的I/O操作都被处理为异步操作,它们包括键盘、鼠标I/O输入输出事件、窗口大小的resize事件、定时器(setTimeout、setInterval)事件、Ajax请求网络I/O回调等。当这些异步任务发生的时候,它们将会被放入浏览器的事件任务队列中去,等到JavaScript运行时执行线程空闲时候才会按照队列先进先出的原则被一一执行,但终究还是单线程。

创建Worker时,JS引擎向浏览器申请开一个子线程(子线程是浏览器开的,完全受主线程控制,而且不能操作DOM)

JS引擎线程与worker线程间通过特定的方式通信(postMessage API,需要通过序列化对象来与线程交互特定的数据)

浏览器渲染流程

拿到内容

  1. 浏览器根据 DNS 服务器得到域名的 IP 地址

  2. 向这个 IP 的机器发送 HTTP 请求

  3. 服务器收到、处理并返回 HTTP 请求

  4. 浏览器得到返回内容

解析内容建立Rendering Tree, 解析HTMl构建dom

  1. dom作用: HTMLDOM是HTML Document Object Model(文档对象模型)的缩写,HTML

DOM则是专门适用于HTML/XHTML的文档对象模型。熟悉软件开发的人员可以将 HTML

DOM理解为网页的API。它将网页中的各个元素都看作一个个对象,从而使网页中的元素也可以被计算机语言获取或者编辑。

  1. dom规定
  • 整个文档是一个文档节点

  • 每个HTML标签是一个元素节点

  • 包含在HTML元素中的文本是文本节点

  • 每一个HTML属性是一个属性节点(属性节点是另一个层面的理解,在浏览器后台打印的时候,不存在属性节点)

  • 注释属于注释节点

  1. 解析过程:浏览器会自动把HTML文档解析为一个“文档对象模型”,即Document Object Model,简称DOM,这是一个树形结构,树根是Document对象,树干是网页的根元素,然后分出两个枝丫,一个是,一个是,然后网页上的其他标签就是这棵树上的树叶和树枝了,通过这个结构,就可以查找和控制网页上的任何一个元素了。因此,可以这么说,网页上的任何元素都是Document对象的子对象。

解析CSS产生CSS规则树,css是由单独的下载线程异步下载的,本身不会阻塞Dom加载,它和DOM结构比较像然后结合DOM生成RenderTree

Javascript解析, 通过 DOM API 和 CSSOM API 来操作 DOM Tree 和 CSS Rule Tree。

布局render树(Layout/reflow),负责各元素尺寸、位置的计算

绘制render树(paint),绘制页面像素信息

标题浏览器会将各层的信息发送给GPU,GPU会将各层合成(composite),显示在屏幕上

渲染过程中的问题

DOMContentLoaded与onload

  • 当 DOMContentLoaded 事件触发时,仅当DOM加载完成,不包括样式表,图片

  • 当 onload 事件触发时,页面上所有的DOM,样式表,脚本,图片都已经加载完成了。 (渲染完毕了)

  • DOMContentLoaded -> load

浏览器如果渲染过程中遇到JS文件怎么处理?

  • 上面说过GUI渲染线程与JS引擎线程是互斥的,所以渲染过程中,如果遇到 没有 defer 或

async,浏览器会立即加载并执行指定的脚本,也就是说不等待后续载入的文档元素,读到就加载并执行。

(延迟执行)

  • defer 属性表示延迟执行引入的 JavaScript,即这段 JavaScript 加载时 HTML

并未停止解析,这两个过程是并行的。整个 document 解析完毕且 defer-script

也加载完成之后(这两件事情的顺序无关),会执行所有由 defer-script 加载的 JavaScript 代码,然后触发

DOMContentLoaded 事件。 defer 与相比普通 script,有两点区别:载入 JavaScript 文件时不阻塞

HTML 的解析,执行阶段被放到 HTML 标签解析完成之后。

在加载多个JS脚本的时候,async是无顺序的加载,而defer是有顺序的加载。

(异步下载)

  • async 属性表示异步执行引入的 JavaScript,与 defer

的区别在于,如果已经加载好,就会开始执行。也就是加载不阻塞,执行会阻塞。

浏览器的回流与重绘 (Reflow & Repaint)

浏览器使用流式布局模型 (Flow Based Layout)。

有了RenderTree,我们就知道了所有节点的样式,然后计算他们在页面上的大小和位置,最后把节点绘制到页面上。

回流

  • 当Render Tree中部分或全部元素的尺寸、结构、或某些属性发生改变时,浏览器重新渲染部分或全部文档的过程称为回流。

  1. 页面首次渲染

  2. 浏览器窗口大小发生改变

  3. 元素尺寸或位置发生改变

  4. 元素内容变化(文字数量或图片大小等等)

  5. 元素字体大小变化

  6. 添加或者删除可见的DOM元素

  7. 激活CSS伪类(例如::hover)

  8. 查询某些属性或调用某些方法

重绘

当页面中元素样式的改变并不影响它在文档流中的位置时(例如:color、background-color、visibility等),浏览器会将新样式赋予给元素并重新绘制它,这个过程称为重绘。