关于js解析的深入学习

364 阅读14分钟

说明

尝试回答几个问题:

  1. 进程和线程有什么不同?
  2. 为什么js引擎是单线程的?
  3. setTimeout和setInterval是怎么实现计时功能的?
  4. js代码的执行会影响页面的渲染吗?
  5. DOMContentLoaded和load的区别?
  6. 你了解硬件加速技术吗?

进程和线程的区别

  • 进程是cpu资源分配的最小单位(是能拥有资源和独立运行的最小单位);
  • 线程是cpu调度的最小单位(线程是建立在进程的基础上的一次程序运行单位,一个进程中可以有多个线程);
  • 每个进程都有自己的资源,同一个进程内的线程可以共享该进程的资源;

做个比喻:

- 进程是一个工厂,工厂有它的独立资源; (系统分配内存)
- 工厂之间相互独立; (进程之间相互独立,通信比较困难)
- 线程是工厂中的工人,多个工人协作完成任务; (多个线程在进程中协作完成任务)
- 工厂内有一个或多个工人; (一个进程由一个或多个线程组成)
- 工人之间共享空间; (同一进程下的各个线程之间共享程序的内存空间)

举个例子:

打开任务管理器,就会看到电脑正在运行的进程,并且每个进程都有自己的内存。

image.png

浏览器的多进程

浏览器是多进程的,浏览器之所以能够运行,是因为系统给它的进程分配了资源(cpu、内存)。简单点理解,每打开一个Tab页,就相当于创建了一个独立的浏览器进程。

可以打开浏览器的任务管理器查看当前的进程,tab标签页与进程并不一定是一一对应的,浏览器可能会有自己的优化策略,将一些进程合并成一个进程。例如:多个空白标签页被合并成一个进程。

image.png

浏览器都包含哪些进程?

浏览器的主要进程有:

  1. Browser进程:浏览器的主进程(负责协调、主控),只有一个。作用有:

    • 负责浏览器界面显示,与用户交互。如前进,后退等;
    • 负责各个页面的管理,创建和销毁其他进程;
    • 将Renderer进程得到的内存中的Bitmap,绘制到用户界面上;
    • 网络资源的管理,下载等;
  2. 第三方插件进程:每种类型的插件对应一个进程,仅当使用该插件时才创建;

  3. GPU进程:最多一个,用于3D绘制等;

  4. 浏览器渲染进程(浏览器内核)(Renderer进程,内部是多线程的):默认每个Tab页面一个进程,互不影响。主要作用为:页面渲染、脚本执行、事件处理等。

在浏览器中打开一个网页相当于新起了一个进程(进程内有自己的多线程)

浏览器多进程的优势

  1. 避免单个page crash影响整个浏览器;
  2. 避免第三方插件crash影响整个浏览器;
  3. 多进程充分利用多核优势;
  4. 方便使用沙盒模型隔离插件等进程,提高浏览器稳定性;

如果浏览器是单进程,那么某个Tab页崩溃了,就影响了整个浏览器,体验有多差;同理如果是单进程,插件崩溃了也会影响整个浏览器。

渲染进程(浏览器内核)

对于前端操作来说,最重要的就是渲染进程。可以这样理解,页面的渲染,JS的执行,事件的循环,都在这个进程内进行。并且浏览器的渲染进程是多线程的,包含的线程有:

  1. GUI渲染线程

    • 负责渲染浏览器界面,解析HTML,CSS,构建DOM树和RenderObject树,布局和绘制等。
    • 当界面需要重绘(Repaint)或由于某种操作引发回流(reflow)时,该线程就会执行。
    • 注意,GUI渲染线程与JS引擎线程是互斥的,当JS引擎执行时GUI线程会被挂起(相当于被冻结了),GUI更新会被保存在一个队列中等到JS引擎空闲时立即被执行。
  2. JS引擎线程

    • 也称为JS内核,负责处理Javascript脚本程序。(例如V8引擎)
    • JS引擎线程负责解析Javascript脚本,运行代码。
    • JS引擎一直等待着任务队列中任务的到来,然后加以处理,一个Tab页(renderer进程)中无论什么时候都只有一个JS线程在运行JS程序。
    • 同样注意,GUI渲染线程与JS引擎线程是互斥的,所以如果JS执行的时间过长,这样就会造成页面的渲染不连贯,导致页面渲染加载阻塞。
  3. 事件触发线程

    • 归属于浏览器而不是JS引擎,用来控制事件循环(可以理解,JS引擎自己都忙不过来,需要浏览器另开线程协助)。
    • 当JS引擎执行代码块如setTimeOut时(也可来自浏览器内核的其他线程,如鼠标点击、AJAX异步请求等),会将对应任务添加到事件线程中。
    • 当对应的事件符合触发条件被触发时,该线程会把事件添加到待处理队列的队尾,等待JS引擎的处理。
    • 注意,由于JS的单线程关系,所以这些待处理队列中的事件都得排队等待JS引擎处理(当JS引擎空闲时才会去执行)。
  4. 定时触发器线程

    • 传说中的setIntervalsetTimeout所在线程。
    • 浏览器定时计数器并不是由JavaScript引擎计数的,(因为JavaScript引擎是单线程的, 如果处于阻塞线程状态就会影响记计时的准确)。
    • 因此通过单独线程来计时并触发定时(计时完毕后,添加到事件队列中,等待JS引擎空闲后执行)。
    • 注意,W3C在HTML标准中规定,规定要求setTimeout中低于4ms的时间间隔算为4ms。
  5. 异步http请求线程

    • 在XMLHttpRequest在连接后是通过浏览器新开一个线程请求。
    • 将检测到状态变更时,如果设置有回调函数,异步线程就产生状态变更事件,将这个回调再放入事件队列中。再由JavaScript引擎执行。

image.png

事件循环机制是基于事件触发线程的,所以要先理解事件触发线程才能彻底理解事件循环机制。

Browser进程和渲染进程(浏览器内核)的通信

如果自己打开任务管理器,然后打开一个浏览器,就可以看到:任务管理器中出现了两个进程(一个是主控进程,一个则是打开Tab页的渲染进程), 然后在这前提下,看下整个的简化过程:

  1. Browser进程收到用户请求,首先需要获取页面内容(譬如通过网络下载资源),随后将该任务通过RendererHost接口传递给Render进程;

  2. Renderer进程的Renderer接口收到消息,简单解释后,交给渲染线程,然后开始渲染:

    • 渲染线程接收请求,加载网页并渲染网页,这其中可能需要Browser进程获取资源和需要GPU进程来帮助渲染;
    • 当然可能会有JS线程操作DOM(这样可能会造成回流并重绘);
    • 最后Render进程将结果传递给Browser进程;
  3. Browser进程接收到结果并将结果绘制出来。

渲染进程(浏览器内核)中多线层之间的关系

GUI渲染线程与JS引擎线程互斥

由于JavaScript是可操纵DOM的,如果在修改这些元素属性同时渲染界面(即JS线程和UI线程同时运行),那么渲染线程前后获得的元素数据就可能不一致了。

因此为了防止渲染出现不可预期的结果,浏览器设置GUI渲染线程与JS引擎为互斥的关系,当JS引擎执行时GUI线程会被挂起, GUI更新则会被保存在一个队列中等到JS引擎线程空闲时立即被执行。

JS阻塞页面加载

从上述的互斥关系,可以推导出,JS如果执行时间过长就会阻塞页面。

举个例子,假设JS引擎正在进行巨量的计算,此时就算GUI有更新,也会被保存到队列中,等待JS引擎空闲后执行。 然后,由于巨量计算,所以JS引擎很可能很久很久后才能空闲,自然会感觉到巨卡无比。所以,要尽量避免JS执行时间过长,这样就会造成页面的渲染不连贯,导致页面渲染加载阻塞的感觉。

WebWorker

针对上述中js执行时间过长会阻塞页面,html5推出了WebWorker,可以用来处理密集型计算。MDN对于WebWorker的官方解释是:

Web Worker为Web内容在后台线程中运行脚本提供了一种简单的方法。线程可以执行任务而不干扰用户界面。

一个worker是使用一个构造函数创建的一个对象(e.g. Worker()) 运行一个命名的JavaScript文件, 这个文件包含将在工作线程中运行的代码; workers 运行在另一个全局上下文中,不同于当前的window, 因此,在 Worker 内通过 window获取全局作用域 (而不是self) 将返回错误。

  • 创建Worker时,JS引擎向浏览器申请开一个子线程(子线程是浏览器开的,完全受主线程控制,而且不能操作DOM)。
  • JS引擎线程与worker线程间通过特定的方式通信(postMessage API,需要通过序列化对象来与线程交互特定的数据)。

WebWorker与SharedWorker的区别

  1. WebWorker只属于某个页面,不会和其他页面的Render进程(浏览器内核进程)共享。所以Chrome在Render进程中(每一个Tab页就是一个render进程)创建一个新的线程来运行Worker中的JavaScript程序。
  2. SharedWorker是浏览器所有页面共享的,不能采用与Worker同样的方式实现,因为它不隶属于某个Render进程,可以为多个Render进程共享使用。所以Chrome浏览器为SharedWorker单独创建一个进程来运行JavaScript程序,在浏览器中每个相同的JavaScript只存在一个SharedWorker进程,不管它被创建多少次。
  3. 本质上就是进程和线程的区别;SharedWorker由独立的进程管理,WebWorker只是属于render进程下的一个线程。

浏览器渲染的简化流程

image.png

  1. 浏览接接收到html内容后,解析html建立dom树;
  2. 解析css构建render树(将CSS代码解析成树形的数据结构,然后结合DOM合并成render树);
  3. 布局render树(Layout/reflow),负责各元素尺寸、位置的计算;
  4. 绘制render树(paint),绘制页面像素信息;
  5. 浏览器会将各层的信息发送给GPU,GPU会将各层合成(composite),显示在屏幕上。

渲染完毕后触发load事件。

load事件与DOMContentLoaded事件的先后顺序

明确顺序为:DOMContentLoaded -> load。

  • 当初始的 HTML 文档被完全加载和解析完成之后,DOMContentLoaded 事件被触发,而无需等待样式表、图像和子框架的完全加载。
  • 当页面上所有的DOM、样式表、脚本、图片都已经加载完成了,才会触发load事件。

css加载是否会阻塞dom树渲染?

这里讨论的是头部引入css的情况,首先明确css是由单独的下载线程异步下载的。

  • css加载不会阻塞DOM树解析(异步加载时DOM照常构建)
  • 但会阻塞render树渲染(渲染时需等css加载完毕,因为render树需要css信息)

普通图层和复合图层

浏览器渲染的图层一般包含两大类:普通图层以及复合图层

复合图层:

首先,普通文档流内可以理解为一个复合图层(这里称为默认复合层,里面不管添加多少元素,其实都是在同一个复合图层中)。其次,absolute布局(fixed也一样),虽然可以脱离普通文档流,但它仍然属于默认复合层。然后,可以通过硬件加速的方式,声明一个新的复合图层,它会单独分配资源 (当然也会脱离普通文档流,这样一来,不管这个复合图层中怎么变化,也不会影响默认复合层里的回流重绘)。

可以在Chrome源码调试 -> More Tools -> Rendering -> Layer borders中看到,黄色的就是复合图层信息。 image.png

复合图层的特点

GPU中,各个复合图层是单独绘制的,所以互不影响,这也是为什么某些场景硬件加速效果特别好。

复合图层的应用

将该元素变成一个复合图层,就是传说中的硬件加速技术,可以独立于普通文档流中,改动后可以避免整个页面重绘,提升性能。但是尽量不要大量使用复合图层,否则由于资源消耗过度,页面反而会变的更卡。

怎么变成复合图层?

  1. 最常用的方式:translate3dtranslateZ
  2. opacity属性/过渡动画(需要动画执行的过程中才会创建合成层,动画没有开始或结束后元素还会回到之前的状态);
  3. will-chang属性(这个比较偏僻),一般配合opacity与translate使用(而且经测试,除了上述可以引发硬件加速的属性外,其它属性并不会变成复合层),作用是提前告诉浏览器要变化,这样浏览器会开始做一些优化工作(这个最好用完后就释放);
  4. <video><iframe><canvas><webgl>等元素;
  5. 其它,譬如以前的flash插件。

absolute和硬件加速的区别

absolute虽然可以脱离普通文档流,但是无法脱离默认复合层。 所以,就算absolute中信息改变时不会改变普通文档流中render树, 但是,浏览器最终绘制时,是整个复合层绘制的,所以absolute中信息的改变,仍然会影响整个复合层的绘制。 (浏览器会重绘它,如果复合层中内容多,absolute带来的绘制信息变化过大,资源消耗是非常严重的)。

而硬件加速直接就是在另一个复合层了(另起炉灶),所以它的信息改变不会影响默认复合层 (当然了,内部肯定会影响属于自己的复合层),仅仅是引发最后的合成(输出视图)。

硬件加速时请使用index

使用硬件加速时,尽可能的使用index,防止浏览器默认给后续的元素创建复合层渲染。

具体的原理是这样的: webkit CSS3中,如果这个元素添加了硬件加速,并且index层级比较低, 那么在这个元素的后面其它元素(层级比这个元素高的,或者相同的,并且releative或absolute属性相同的), 会默认变为复合层渲染,如果处理不当会极大的影响性能。

简单点理解,其实可以认为是一个隐式合成的概念:如果a是一个复合图层,而且b在a上面,那么b也会被隐式转为一个复合图层,这点需要特别注意。

事件循环机制

在下一篇文章中具体介绍js的事件循环。

总结

注意css代码和html代码的书写顺序,应该先解析css再解析html,防止出现白屏、闪烁的情况。注意js代码的执行时间,js的执行也会影响到页面的渲染。妥善使用硬件加速技术,使用不当反而会影响性能。