前端知识整理 - 浏览器 & html 篇1. 使用 chrome 浏览器打开一个页面，要启动哪些进程？打开 chr

1. 使用 chrome 浏览器打开一个页面，要启动哪些进程？

打开 chrome浏览器 时，启动的进程包括: 一个浏览器主进程、一个GPU进程、一个网络进程、多个渲染进程、多个插件进程。

各个进程的功能如下：

浏览器主进程。

主要负责 界面展示、用户交互、子进程管理，同时 提供存储功能 等，如 控制标签栏、地址栏书签、前进后退按钮、文件访问 等。
网络进程。

主要负责 网络资源的加载。
渲染进程。

将 HTML、css、js 转化为 用户可与之交互的网页。默认情况下，会为每一个 tab 页开启一个渲染进程。
GPU进程。

用于处理其他进程发出的 图像处理任务。
插件进程。

主要负责 插件的运行。

2. 从输入 url 到页面展示，中间经历了什么过程？

从 输入url到最后页面展示，需要 浏览器各个进程 之间的分工协作，具体如下:

浏览器进程处理用户输入

当用户在 浏览器地址栏 中输入 关键字 时， 地址栏 会判断输入的 关键字 是 搜索的内容还是 请求的 url。
- 如果是 搜索内容，地址栏 会使用 浏览器默认的搜索引擎，来 合成新的搜索关键字的 URL。
- 如果是 请求 url，地址栏 会将 输入的关键字 转化为 完整的 url。
当浏览器开始加载一个 url 地址后，页面还是原来的页面，还没有替换为要加载的 url 对应的页面。

处理完用户输入以后，浏览器进程 会将 URL 请求 发送给 网络进程。
网络进程处理浏览器进程发送的 URL 请求

具体的处理过程如下:
1. 查找本地缓存是否有缓存资源。
  
  如果有，直接将 缓存的资源 传递给 浏览器进程；如果没有，进入第二步，开始 网络请求流程。
2. 获取请求域名对应的 IP 地址。
  
  系统会首先自动从 hosts 文件中寻找域名对应的 IP 地址，一旦找到，和服务器建立 TCP 连接；如果没有找到，则系统会将网址提交 DNS 域名解析服务器 进行 IP 地址的解析。
3. 利用 IP 地址，通过 三次握手，建立与服务器之间的 TCP 连接。
4. 建立连接以后，构建 http 请求报文，发送给服务器。
5. 服务器接收到请求信息以后，构建 响应信息, 发送给网络进程。
6. 网络进程 接收到 响应信息 以后，解析响应信息。
  
  如果返回的响应信息的状态码是 301、302，根据响应头提供的 Location 字段 进行重定向，然后重头开始。
  
  如果返回的响应信息的状态码是 200，说明服务器返回了请求的数据。此时，需要根据响应头提供的 content-type 字段来选择对应的方式来处理响应内容。如果 content-type 的值为 'application/octet-stream', 为 下载类型，该请求会提交给浏览器的下载管理器，同时该 URL 请求流程 结束。如果 content-type 的值为 'text/html', 为 网页类型，通知 浏览器进程准备渲染界面。
准备渲染进程

为新页面分配一个 渲染进程。

分配策略:
- 通常情况下，打开新的页面都会使用单独的渲染进程；
- 如果从 A 页面打开 B 页面，且 A 和 B 都属于同一站点的话，那么 B 页面复用 A 页面的渲染进程；如果是其他情况，浏览器进程则会为 B 创建一个新的渲染进程。
渲染进程 准备好之后，还不能立即进入 文档解析状态，因为此时的文档数据还在 网络进程 中，并没有提交给 渲染进程，所以下一步就进入了 提交文档阶段。
提交文档

所谓 提交文档，就是指 浏览器进程将网络进程接收到的 HTML 数据提交给渲染进程。

具体流程是这样的：
1. 首先当 浏览器进程接收到网络进程的响应头数据 之后，便向渲染进程发起 “提交文档” 的消息；
2. 渲染进程 接收到 “提交文档” 的消息后，会和 网络进程 建立 传输数据的“管道”；
3. 等文档数据 传输完成之后，渲染进程 会返回 “确认提交” 的消息给 浏览器进程；
4. 浏览器进程 在收到 “确认提交” 的消息后，会更新 浏览器界面状态，包括了 安全状态、地址栏的 URL、前进后退的历史状态，并 更新 Web 页面。
渲染页面

渲染进程 渲染页面。

3. 浏览器渲染的过程

构建 dom 树；

浏览器无法直接理解和使用 HTML, 所以要使用 解析器 将 HTML 转化为浏览器能够理解的结构 - dom 树。

通过 document 可以直接访问 dom 树。
样式计算；

样式计算 的目的是为了 计算出 DOM 节点中每个元素的具体样式，这个阶段分为三步完成：
1. 把 css 转化为浏览器能够理解的的结构
  
  css 样式 的来源有三种：外部样式表、内部样式表、内联样式。
  
  和 HTML 文件 一样，浏览器无法理解 纯文本的 CSS 样式，所以当 渲染引擎 接收到 CSS 文本 时，会执行一个转换操作，将 CSS 文本 转化为 浏览器能够理解的结构 - styleSheets。
  
  通过 documnet.styleSheets 可以访问 styleSheets。
2. 转化样式表中的属性值，使其标准化
  
  对属性值进行标准化操作，将 属性值 转化为 渲染引擎容器理解的、标准化的计算值，如将 em 转化为 px。
3. 计算出 DOM 树中每个节点的具体样式
  
  样式计算 的目的是为了 计算 DOM 节点中每个元素的具体样式，在计算过程中需要遵循 CSS 继承 和层叠两个规则。这个阶段最终输出的内容是 每个 DOM 节点的样式，并被保存在 ComputedStyle 的结构内。
  
  CSS 继承 就是 每个 DOM 节点都包含父节点可继承的样式。
  
  CSS 层叠 定义了 如何合并来自多个源的属性(优先级)。
布局阶段；

布局阶段 的主要任务是计算 DOM 树中可见节点的几何位置。

布局阶段 分为两步 - 创建布局树 和 布局计算：
1. 创建布局树；
  
  在显示之前，我们还需要构建一颗 只包含可见元素的布局树。
  
  布局树 的结构和 dom 树 的结构相同，只是 不包含不可见的节点，如 head 节点、display 为 none 的节点等。
2. 布局计算；
  
  计算 布局树节点 的 几何位置。
分层

页面中有很多复杂效果，如复杂的的 3D 变换、页面滚动、使用 z-index 做 z 轴排序等。为了实现这些效果，渲染引擎还要为特定的节点生成专用的图层，并生成一颗对应的 图层树 - layer tree。

浏览器的页面实际上被分成了图层，这些图层叠加后生成了最后的页面。

并不是 布局树 中的每一个节点都包含一个图层，如果一个节点没有对应的图层，那么这个节点就从属于 父节点的图层。

通常情况下，只要满足下面两点中的任意一点，元素都会被提升到一个单独的图层：
- 拥有层叠上下文上下文属性的元素会被提升到单独的一层；
  
  层叠上下文 由满足下面任意一个条件生成：
  - 文档根元素 - html；
  - position 为 absolute 或者 relative 且 z-index 不为 auto；
  - position 为 fixed；
  - flex 容器的子元素，且 z-index 不为 auto；
  - grid 容器的子元素，且 z-index 不为 auto；
  - opacity 属性值小于 1 的元素；
  - transform、filter、perspective、clip-path、mask、mask-img、mask-border 不为 none 的元素；
  - isolation 属性值为 isolate 的元素；
  - contain 属性值为 layout、paint 或包含他们其中之一的合成值；
  z-index, 默认值为 auto，图层顺序与父节点的一致。
  
  子级层叠上下文的 z-index 只有在父级中才有意义。子元素的 z-index 相对应于父元素生效。
- 需要 clip 的地方也会被创建为图层
  
  当元素内容超出且 overflow 为 auto 或者为 scroll 时，内容会被 clip，创建一个新的图层。
  
  overflow 为 visible、hidden，内容不会被 clip。
为每个图层生成绘制列表，并将其提交到合成线程

绘制阶段 并不是真正的绘制图片，而是 将每一个图层转化为一个绘制指令列表。
合成线程 将图层分成图块，并在光栅化线程池中将图块转换成位图。

根据图层对应的绘制指令列表，生成图片，然后将多层图片合成为一张图片。
合️成线程 发送绘制图块命令 DrawQuad 给 浏览器进程
浏览器进程 根据 DrawQuad 消息生成页面，并显示到显示器上

重排：修改元素属性如 width、heigth， 导致重新布局、分层。

重绘：修改元素属性如 background，跳过布局、分层，直接绘制。

合成： 跳过布局、绘制，直接合成。

js 的执行，会阻塞 dom 树的生成。

CSS 阻塞了，会阻塞 dom 树的生成，不会阻塞页面的显示。

4. 事件循环 - event loop

浏览器渲染进程 工作的时候，有一个 主线程 在运行，这个主线程主要负责 js 代码的执行 和 浏览器渲染。

js 代码的执行 和 浏览器渲染 过程是互斥的，即在某一个时间点，主线程只能 执行 js 代码 或者 浏览器渲染。

主线程 是 循环工作 的，每一个循环是一个 tick，在这个 tick 内，如果有 js 代码 需要执行，就要去 执行 js 代码；如果需要有 dom 操作需要更新渲染，就要去渲染。

主线程 要执行的 js 代码，是从 任务队列 中获取的。任务队列 中的每一个任务，都对应主线程要执行的 js 代码，如 主 js 代码、 事件回调、 请求回调、 setTimeout 回调 等。由于 js 是 单线程 的，为了 防止主线程被阻塞，在遇到 ajax 请求、 setTimeout 等操作时，会为对应的 callback 构建一个任务，然后继续处理剩下的代码。等 请求成功、setTimeout 延时到达 时，将对应的任务添加到任务队列中，等待 下一次循环 中被 主线程处理。

主线程 在每次循环过程中，如果 任务队列 不为空，会从任务队列中获取一个任务，将对应的 js 代码 放入 执行栈 中执行。

在执行 js 代码 的过程中，如果遇到 promise、 mutationObserver 等异步任务时，会将对应的 callback 添加到 微任务队列 中。等 执行栈中的 js 代码处理完毕以后，处理 微任务队列 中的任务。等 微任务队列 中的代码处理完毕以后，本次事件循环的 js 代码才算处理完毕。

在一次 事件循环 中，执行 js 代码时，如果发生 dom 操作，主线程并不会在 js 代码执行完毕以后立即去渲染。 何时去渲染是由浏览器的刷新频率决定的，只有浏览器要刷新，且有 dom 操作需要更新，主线程才会进行浏览器渲染。

一次 事件循环，主线程需要做的事情:

从任务队列中获取任务；
将 任务对应的 js 代码 放入 执行栈 中处理，如果遇到 promise、 mutationObserver 等，将对应的 callback 添加到 微任务队列 中;
将 微任务队列 中任务对应的 js 代码放入执行栈中处理，直到 微任务队列 清空；
如果有 dom 操作需要更新且浏览器要刷新，进行 浏览器渲染。

5. requestAnimationFrame

requestAnimationFrame，在进行 浏览器渲染 的时候，执行 js 代码， requestAminationFrame 在 处理 css(样式计算) 和绘制之前执行。

requestAnimationFrame 的执行取决与浏览器的刷新频率。每一轮事件循环， requestAnimationFrame 不一定会触发，只有在浏览器刷新且更新dom的时候才会触发。

要使用 requestAnimationFrame 做动画，不要使用 setTimeout 做动画。

帧，图形处理器 每秒钟能够刷新的次数，通常用 fps (Frames Per Seconds)。

每一帧都是 静止的图象，快速连续地显示帧便形成了运动的假象。高的帧率可以得到更流畅、更逼真的动画。每秒钟帧数 (fps) 愈多，所显示的动作就会愈流畅。

浏览器的刷新频率是 60 Hz，即 1 秒钟可以刷新60次，也就说是浏览器对每一帧画面的渲染工作要在 16ms 内完成，超出这个时间，页面的渲染就会出现卡顿现象，影响用户体验。

使用 requestAnimationFrame 不需要设置具体的时间，由 系统来决定回调函数的执行时间，requestAnimationFrame 里面的回调函数是在页面刷新之前 执行，它跟着屏幕的刷新频率走，保证每个刷新间隔只执行一次，如果页面未激活的话，requestAnimationFrame 也会停止渲染，这样既可以保证页面的流畅性，又能节省主线程执行函数的开销。

而 setTimeout 是在 特定的时间间隔去执行任务，不到时间间隔不会去执行，这样浏览器就没有办法去自动优化

6. 宏任务&微任务

宏任务: script 整体代码、 setTimeout、 messageChanel、I/O、渲染、 setInterval、用户交互、网络请求

setTimeout 默认的最小延时时间为: 4.x ms, 即 setTimeout 执行以后， 4.x ms 之后， callback 对应的任务才会添加到任务队列中。

messageChanel， postMessage 执行以后， 0.1(0.2) ms以后， callback 对应任务才会添加到任务队列中。

微任务: Promise、MutationObserver、 process.nextTick。

MutationObserver 方案的核心就是采用了 微任务机制，有效地权衡了实时性和执行效率的问题。

微任务 和 宏任务 是绑定的，每个 宏任务 在执行时，会创建自己的 微任务队列。

微任务 的执行时长会影响到 当前宏任务的时长。

在一个 宏任务 中，分别创建一个用于回调的 宏任务 和 微任务，无论什么情况下，微任务都早于宏任务执行。

7. 变量提升(Hoisting)

所谓 变量提升，是指 javascript 代码 在执行过程中，javascript 引擎将 变量、函数的声明部分 提升到 代码头部 的行为。

变量被提升以后，会被设置默认值，即 undefined。

变量提升 的原因: 一段 javascript 代码 的执行要经历两个阶段：编译阶段和执行阶段。javascript 代码在经过 编译阶段 后，会生成两个部分：执行上下文和可执行代码。执行上下文 是 javascript 引擎 执行一段代码的 运行环境，包含 this、定义的变量(undefined)、定义的函数 等。进入 执行阶段 后，javascript 引擎开始执行可执行代码，从执行上下文中获取需要的变量和函数以及给执行上下文中的变量赋值。

编译阶段生成执行上下文时，函数会覆盖同名变量，并且后定义的函数会覆盖先定义的同名函数。

重点: javascript 的执行机制: 先编译，后执行。

变量提升 可能导致的问题:

变量容器在不被察觉的情况下被覆盖；

var name = 'zhangjh'
function showName() {
    console.log(name)  // undefined 被覆盖
    var name = 'xxq'
    console.log(name) // xxq
}
showName()

本应销毁的变量没有被销毁；

if(true) {
    var name = '123'  // if 语句块结束以后， name 还存在；
}

8. 执行上下文(Execution Context)

执行上下文，是 javascript 引擎执行一段代码的 运行环境，在 javascript 代码的 编译阶段 构建。

一般情况下，执行上下文 的构建有如下几种情况:

全局执行上下文

javascript 在执行 全局代码 的时候，会 编译全局代码 并构建一个 全局执行上下文。全局执行上下文有且只有一个，只有在页面关闭的时候才会被销毁。
函数执行上下文

当 调用一个函数 的时候，函数内部的代码 会先被编译生成一个 函数执行上下文。一般情况下，函数执行完毕以后，对应的 函数执行上下文 会被销毁。

当使用 eval函数 时，eval 中的代码也会被编译生成一个 函数执行上下文。

9. 调用栈(call stack)

调用栈 是用来 管理函数调用关系 的一种 数据结构(栈)，存储的数据为 执行上下文。

执行 javascript 代码时，会先构建一个 全局执行上下文，然后入栈。遇到 函数调用 时，构建一个 函数执行上下文，然后入栈。当 函数执行完毕 以后， 函数执行上下文出栈。全局执行上下文 会一直存在于 调用栈 的底部。

通过 调用栈，我们可以 追踪到哪个函数正在被执行以及各个函数之间的调用关系。

调用栈是有大小限制的。当 入栈的执行上下文 超过一定数量后， javascript 引擎 就会报错，这种错误称为 栈溢出(stack overflow)。

一般情况下，写 递归代码 时，没有终止条件，容易出现 栈溢出。

10. 作用域(scoped)

作用域，指变量和函数的可访问范围，决定了变量和函数的可见性和生命周期。

目前，javascript 中的 作用域 有三种:

全局作用域

作用域 中的变量、函数在 代码的任何位置 都可以被访问，其 生命周期伴随着页面的生命周期。
函数作用域

函数中定义的变量、函数，只能在 函数内部 被访问，不能在 函数外部 被访问。函数执行完毕以后，函数内部定义的变量、函数就会被销毁。(闭包除外)
块级作用域

在 if、for、switch、{}、while 等区域块中，如果有通过关键字 let、const 定义变量，那么这些变量不能被 区域块外部 访问。等 区域块对应的代码 执行完毕以后，通过 let、const 关键字定义的变量会被销毁。

11. let & const

E6 中引入了 let 和 const，使得 js 有了 块级作用域。块级作用域定义的变量，不能被外部使用。

在代码块内，使用 let、const 命令声明变量之前，该变量都是不可用的。这在语法上，称为 “暂时性死区”。凡是在声明之前就使用这些变量，就会报错。

暂时性死区 的本质就是，只要一进入当前作用域，所要使用的变量就已经存在了，但是不可获取，只有等到声明变量的那一行代码出现，才可以获取和使用该变量。

可以理解为在编译阶段已经为 let、const 声明的变量分配内存，但在赋值之前，这些内存是不能被访问的，否则会报错。

const 声明的变量不得改变值，这意味着，const 一旦声明变量，就必须立即初始化，不能留到以后赋值。 先声明后赋值，会报错。

const 并不能保证变量的值不被改变。如果变量的值是数字、字符串、布尔，值不能被改变；如果值是 对象(引用类型)，变量不能被 重新赋值，但是 对象的属性可以改变。

const 声明的变量保存在栈空间中，只能保证栈空间中的值不能改变。如果栈空间中存的是引用类型的在堆空间的地址，堆空间地址不可变，但是堆空间中存储的值可以变。

12. 作用域链

在函数内部查找某个变量，如果函数内部没有，就去外部函数内部查找，直到全局作用域为止，这样的查找链条，就称之为作用域链。

函数定义 的时候，有一个内部属性 - [[scope]]。[[scope]] 属性对应一个列表，该列表称之为函数的 作用域链。当一个函数创建后，它的 作用域链 会被 全局作用域 或者 外部函数对应的执行上下文的作用域链 初始化。当函数执行时，会构建一个 活动对象 添加到 执行上下文作用域链 的前端。这样在函数内部查找一个变量时，按照作用域链按序查找。

13. 闭包

一般情况一下，一个函数执行完毕，函数内部定义的变量都会被销毁，函数外部不可访问。如果这个函数定义了一个内部函数并返回，那么外部函数定义的变量不会被销毁，还可以被内部函数访问，这样就形成了闭包。

内部函数 定义的时候，外部函数执行时构建的 活动对象 也会保存到 内部函数 的作用域链中，导致 外部函数定义的还被使用的变量 不被销毁。

14. this

函数执行上下文 和 this 不能混为一谈，函数执行上下文包含 this。

嵌套函数 的 this 指向 window，不会从外部函数继承。

普通函数 执行时， this 默认指向 window， 严格模式 下，指向 undefined。

15. new 关键字

执行 new Func() 时， javascript 引擎做了如下工作:

创建一个继承自 Func 的空对象 - tempObj；
接着调用 Func.call 方法，并将 tempObj 作为 call 方法的参数，这样当 Func 的执行上下文创建时，它的 this 就指向了 tempObj 对象；
执行 Func；
如果 Func 没有指定返回值，返回 tempObj；

function simulateNew(func) {
    if (typeof func !== 'function') {
        throw 'param is not a constructor'
    }
    var tempObj = {};
    Object.setPrototype(tempObj, func.prototype)
    return func.call(tempObj) || tempObj
}

16. 静态语言 & 动态语言 & 弱类型语言 & 强类型语言

静态语言：使用之前需要确认变量的数据类型；

动态语言：运行时才能确认变量的数据类型；

弱类型语言：支持隐式类型转换；

强类型语言：不支持隐式类型转换；

17. 数据类型

原始类型：Number、String、Boolean、Symbol、Null、undefined、 BigInt

引用类型： Objet

原始类型 的赋值是 完整复制变量值，而 引用类型 的赋值是 复制引用地址。

js 代码运行时，原始类型 存储在 栈空间(执行栈) 中， 引用类型 存储在 堆空间

栈空间存储的仅仅是对象在堆空间中的地址。

18. 垃圾回收

由于 js 程序运行时，原始类型的数据 通过 执行上下文 保存在 栈空间 中， 对象类型的数据 保存在 堆空间中，所以垃圾回收分为两种: 栈中数据回收 和 堆中数据回收。

栈中数据回收

程序执行完毕以后，执行上下文出栈，所占具的 栈空间自动回收。
堆中数据回收

堆空间 中的的垃圾数据，通过 js 的 垃圾回收器 来处理。

V8 会把堆分为 新生代 和 老生代 两个区域，新生代中存放的是生存时间短的对象，老生代中存放的生存时间久的对象。新生区 通常只支持 1～8M 的容量，而 老生区 支持的容量就大很多了。

堆空间的垃圾数据回收要经历: 垃圾数据标记、删除垃圾数据、整理内存。

对于这两块区域，V8 分别使用两个不同的垃圾回收器，以便更高效地实施垃圾回收:
- 副垃圾回收器
  
  负责回收 新生区中的数据。
  
  新生区对半分为 对象区域 和 空闲区域。新加入的对象都会存储到 对象区域 中。等对象区域快被填满时，进行垃圾回收。先将 对象区域 内的 垃圾数据 标记，然后将 存活的数据 转移到 空闲区域，并 按序排列，然后清空 对象区域。这样原来的对象区域变为空闲区域，原来的空闲区域变为对象区域。
  
  为了执行效率，一般新生区的空间会被设置得比较小。
  
  JavaScript 引擎采用了对象晋升策略，也就是经过两次垃圾回收依然还存活的对象，会被移动到老生区中。
- 主垃圾回收器
  
  负责回收 老生区 中的数据。除了新生区中晋升的对象，一些大的对象会直接被分配到老生区。
  
  回收过程: 垃圾数据标记、删除垃圾数据、整理内存。
  
  为了降低 老生代 的垃圾回收而造成的卡顿，V8 将 标记过程 分为一个个的子标记过程，同时让垃圾回收标记和 JavaScript 应用逻辑交替进行，直到标记阶段完成，我们把这个算法称为 增量标记（Incremental Marking）算法。
  
  weakSet 中存储的引用，不计入垃圾回收机制。只要对象在外部消失， weakSet 里面的引用会自动消失。weakSet 不支持遍历操作，不支持 keys、values、entries 方法，也没有 size 属性，仅支持 add、has、delete 方法。
  
  weakMap 中键名所引用的对象，也不计入垃圾回收机制。只要对象在外部消失，weakMap 里面的键名和键值自动消失。因此，由于垃圾回收机制， weakMap 没有遍历操作(即不支持 keys、values、entries)，也没有 size 属性，不支持 clear 方法，仅支持 set、get、has、delete。

19. 编译器(compiler) & 解释器(Interpreter)

之所以存在 编译器 和 解释器，是因为机器不能直接理解我们所写的代码，所以在执行程序之前，需要将我们所写的代码“翻译”成机器能读懂的机器语言。按语言的执行流程，可以把语言划分为 编译型语言 和 解释型语言

编译型语言: 编译型语言在程序执行之前，需要经过编译器的编译过程，并且编译之后会直接保留机器能读懂的二进制文件，这样每次运行程序时，都可以直接运行该二进制文件，而不需要再次重新编译了。比如 C/C++、GO 等都是编译型语言。 一次编译，多次执行。

解释型语言: 每次运行时都需要通过 解释器 对程序进行动态解释和执行。比如 Python、JavaScript 等都属于解释型语言。

20. V8 引擎运行 js 代码

V8 引擎运行 js 代码的过程:

通过 解释器 将 源代码 转化为 抽象语法树(AST)，并生成执行上下文;

AST 是代码的 结构化表示，是一种非常重要的数据结构。Babel、Eslint、webpack 工作过程中都使用了 AST。
根据 AST 生成 字节码；

字节码 就是介于 AST 和 机器码 之间的一种代码。但是与特定类型的机器码无关，字节码 需要通过 解释器 将其转换为机器码后才能执行。
执行字节码；

解释器 逐条执行字节码。

如果一段代码被执行多次( 热点代码 )，就会被编译为 机器码。

21. Babel 的工作流程

Babel 的工作流程:

parse - 将 ES6 代码 转化为 AST；
transform - 分析 AST，将 ES6 对应的 AST 转化为 ES5 对应的 AST;
generator - 将 ES5 对应的 AST 转化为 ES5 代码；

22. TCP 可靠传输

TCP（Transmission Control Protocol，传输控制协议） 是一种 面向连接的、可靠的、基于 字节流 的 传输层通信协议。

TCP 的特点:

对于数据包丢失的情况，TCP 提供 重传机制；
TCP 引入了数据包 排序机制，用来保证把乱序的数据包组合成一个完整的文件。

一个完整的 TCP 连接的生命周期包括 建立连接、传输数据、断开连接 三个阶段:

首先，建立连接阶段

这个阶段是通过 “三次握手” 来建立客户端和服务器之间的连接。

TCP 提供面向连接的通信传输。面向连接是指在数据通信开始之前先做好两端之间的准备工作。

所谓 三次握手，是指在建立一个 TCP 连接 时，客户端和服务器总共要发送 三个数据包 以确认连接的建立。

三次握手:
1. 建立连接时，客户端发送 请求连接包，等待服务器确认；
2. 服务器收到 请求包，发出 确认包；
3. 客户端收到服务器的 确认包，向服务器发送 确认包；
其次，传输数据阶段

在该阶段，接收端需要对每个数据包进行确认操作，也就是接收端在接收到数据包之后，需要发送确认数据包给发送端。所以当发送端发送了一个数据包之后，在规定时间内没有接收到接收端反馈的确认消息，则判断为数据包丢失，并触发发送端的 重发机制。

同样，一个大的文件在传输过程中会被拆分成很多小的数据包，这些数据包到达接收端后，接收端会按照 TCP 头中的序号为其排序，从而保证组成完整的数据。
最后，断开连接阶段

数据传输完毕之后，就要终止连接了，涉及到最后一个阶段 “四次挥手” 来保证双方都能断开连接。

四次挥手:
1. 客户端 进程发出 连接释放报文，并且停止发送数据;
2. 服务器 收到 连接释放报文，发出 确认报文;
3. 客户端 收到 服务器 的 确认请求 后，进入 等待状态，等待 服务器 发送 连接释放报文；
4. 服务器 将最后的数据发送完毕后，就向客户端发送 连接释放报文；
5. 客户端 收到 服务器 的 连接释放报文 后，必须发出确认；
  
  2∗∗MSL（最长报文段寿命）的时间后，当客户端撤销相应的TCB后，才进入 CLOSED 状态。
6. 服务器 只要收到了客户端发出的确认，立即进入 CLOSED 状态。

23. setTimeout

通过 setTimeout 可以定义一个定时器。

setTimeout 定义的 callback 对应的任务会在定时器时间到了以后，添加到任务队列中。

setTimeout 的任务会被延时，即定时器时间到了也不会按时执行。

setTimeout(callback, 0), 实际是 4.x ms 以后执行。

24. callback

将一个函数作为参数传递给另外一个函数，那 作为参数的这个函数 就是 回调函数。

同步回调: callback 在主函数内部执行。

异步回调: callback 在主函数外部执行。

25. Promise

解决的问题:

消灭嵌套调用；
合并多个任务的错误处理；

延迟绑定技术

var a = new Promise(function(resolve, reject) {
    resolve(1)
    Promise.resolve(2).then(function(e) {console.log(e)})
})
a.then(function(e) {console.log(e)})

// 结果是 2 1

promise 实例的 then 方法执行时，如果 promise 对象的状态变为 resolved，将 callback 添加到 微任务队列 中；如果 promise 对象的状态为 pending，先缓存 callback，等到状态变为 resolved，才放入 微任务队列 中。

resolve 方法会将 promise 对象的状态变为 resolved，如果此时 promise 对象没有注册 callback，无法将 callback 添加到微任务队列中。

26. DOM

从网络传给渲染引擎的 HTML 文件字节流 是无法直接被 渲染引擎 理解的，所以要将其转化为 渲染引擎 能够理解的 内部结构，这个结构就是 DOM。

DOM 提供了对 HTML 文档结构化的表述。

在 渲染引擎 中，DOM 有三个层面的作用：

从 页面的视角 来看，DOM 是生成页面的 基础数据结构。
从 JavaScript 脚本 视角来看，DOM 提供给 JavaScript 脚本操作的接口，通过这套接口，JavaScript 可以对 DOM 结构进行访问，从而改变文档的结构、样式和内容。
从安全视角来看，DOM 是一道安全防护线，一些不安全的内容在 DOM 解析阶段就被拒之门外了

在 渲染引擎 内部，有一个叫 HTML 解析器（HTMLParser） 的模块，它的职责就是负责将 HTML 字节流 转换为 DOM 结构。

HTML 解析器并不是等整个文档加载完成之后再解析的，而是网络进程加载了多少数据，HTML 解析器便解析多少数据。

js 脚本 对 DOM 解析的影响：

js 脚本的执行，会阻塞 DOM 解析
js 脚本的下载，也会阻塞 DOM 解析

针对 js 脚本的下载，Chrome 做了 预解析优化。当渲染引擎收到字节流之后，会开启一个 预解析线程，用来分析 HTML 文件中包含的 JavaScript、CSS 等相关文件，解析到相关文件之后，预解析线程会提前下载这些文件。

如果 JavaScript 文件中没有操作 DOM 相关代码，就可以将该 JavaScript 脚本设置为 异步加载，通过 async 或 defer 来标记代码。async 和 defer 虽然都是异步的，不过还有一些差异，使用 async 标志的脚本文件一旦加载完成，会立即执行；而使用了 defer 标记的脚本文件，需要在 DOMContentLoaded 事件之前执行。

如果有多个 defer 脚本，会按照它们在页面出现的顺序加载，而多个 async 脚本是不能保证加载顺序的

如果 js 代码中可能需要操作 外部样式表 中的样式，在执行 js 之前，还需要等待 外部的 CSS 文件下载完成，并解析生成 CSSOM 对象之后，才能执行 JavaScript 脚本。

解析 DOM 过程 中，如果有外部样式表、外部js文件，会开启一个预解析线程，并行请求外部文件，和主线程 并行工作。js 脚本的执行，需要等待所有的外部样式表下载并解析为CSSOM以后才能执行。

尽管js脚本是并行下载的，但如果不是异步脚本，是按序执行的，如果还没有下载完成，需要等待下载完成以后才能执行。

不管 CSS 文件和 JavaScript 文件谁先到达，都要先等到 CSS 文件下载完成并生成 CSSOM，然后再执行 JavaScript 脚本，最后再继续构建 DOM，构建布局树，绘制页面。

HTML 解析器不属于主线程。 DOM 树的构建不会影响浏览器渲染。当浏览器屏幕刷新时，会把构建好的 dom 结构先渲染出来。

27. CSSOM

和 HTML 一样，渲染引擎 也是无法直接理解 CSS 文件内容 的，所以需要将其解析成渲染引擎能够理解的结构，这个结构就是 CSSOM。

和 DOM 一样，CSSOM 也具有两个作用:

提供给 JavaScript 操作样式表的能力;
第二个是为 布局树的合成 提供基础的样式信息。

这个 CSSOM 体现在 DOM 中就是 document.styleSheets。

28. 解析白屏

从发起 URL 请求 开始，到 首次显示页面的内容，在视觉上经历的三个阶段：

第一个阶段，等请求发出去之后，到提交数据阶段，这时页面展示出来的还是之前页面的内容;
第二个阶段，提交数据之后渲染进程会创建一个 空白页面，我们通常把这段时间称为解析白屏，并等待 CSS 文件和 JavaScript 文件的加载完成，生成 CSSOM 和 DOM，然后 合成布局树，最后还要经过一系列的步骤准备首次渲染;
第三个阶段，等首次渲染完成之后，就开始进入完整页面的生成阶段了，然后页面会一点点被绘制出来

在第二个阶段，如果白屏时间过久，就会影响用户体验。

影响白屏时间的因素，主要有 css 脚本下载、 js 脚本下载、 js 脚本执行。

优化措施：

可以内联，尽量内联；
无法内联，尽量减少外部文件的体积；
不需要操作 dom 的外部 js 脚本，设置为异步；
css 脚本体积较大时，可以分离成多个，根据媒体查询，按需加载；

29. 分层 & 合成

准备知识：

显示器如何显示图像

每个显示器都有固定的刷新频率，通常是 60HZ，也就是每秒更新 60 张图片，更新的图片都来自于显卡中一个叫前缓冲区的地方，显示器所做的任务很简单，就是每秒固定读取 60 次前缓冲区中的图像，并将读取的图像显示到显示器上。
显卡做了什么

显卡的职责就是合成新的图像，并将图像保存到后缓冲区中，一旦显卡把合成的图像写到后缓冲区，系统就会让后缓冲区和前缓冲区互换，这样就能保证显示器能读取到最新显卡合成的图像。
帧 & 帧率

帧： 渲染流水线生成的每一副图片称为一帧

帧率：渲染流水线每秒更新了多少帧称为帧率

由于用户很容易观察到那些丢失的帧，如果在一次动画过程中，渲染引擎生成某些帧的时间过久，那么用户就会感受到卡顿，这会给用户造成非常不好的印象。

要解决卡顿问题，就要解决每帧生成时间过久的问题，为此 Chrome 对浏览器渲染方式做了大量的工作，其中最卓有成效的策略就是引入了分层和合成机制。

浏览器重新渲染的方式有三种：重排、重绘、合成:

重排: 需要重新布局，然后分层、绘制、合成。
重绘：不需要重新布局、分层，直接绘制、合成。
合成：不需要重新布局、分成、绘制，直接合成。

合成操作是在合成线程上完成的，不会影响主线程。

css 动画比 js 动画高效的原因： 渲染引擎会通过合成线程直接处理变换，而不设计主线程。

js 动画优化：可以通过 will-change 属性，将 对应的元素单独实现一层。等 will-change 指定的属性发生变换时，通过 合成线程 处理这些变换。

30. 系统优化页面

加载阶段 优化:

尽量内联；
减小请求文件的大小；
使用 CDN；

在加载阶段，核心的优化原则是：优化关键资源的加载速度，减少关键资源的个数，降低关键资源的 RTT 次数。

交互阶段 优化:

减少 js 脚本执行的时间

分解任务、web worker
避免同步强制布局

js 中进行 dom 操作以后，马上读取 dom 操作改变的属性，导致渲染引擎执行一次布局操作，导致多布局一次。

先读取属性，再进行 dom 操作
避免布局抖动

所谓 布局抖动，是指在一次 JavaScript 执行过程中，多次执行 强制布局 和 抖动操作。
合理利用 css 合成动画

合成动画 是直接在 合成线程 上执行的，这和在 主线程 上执行的布局、绘制等操作不同，如果主线程 被 JavaScript 或者一些布局任务占用，CSS 动画依然能继续执行。所以要尽量利用好 CSS 合成动画，如果能让 CSS 处理动画，就尽量交给 CSS 来操作。

另外，如果能提前知道对某个元素执行动画操作，那就最好将其标记为 will-change，这是告诉渲染引擎需要将该元素单独生成一个图层。
避免频繁的垃圾回收

优化数据结构。

在交互阶段，核心的优化原则是：尽量减少一帧的生成时间。可以通过减少单次 JavaScript 的执行时间、避免强制同步布局、避免布局抖动、尽量采用 CSS 的合成动画、避免频繁的垃圾回收等方式来减少一帧生成的时长。

31. 渐进式网页应用 - PWA

稍后...

32. WebComponent

稍后...

33. 浏览器安全

浏览器安全 可以分为三类： web 页面安全、浏览器网络安全、浏览器系统安全。

34. 同源策略

同源策略：如果两个 URL 的协议、域名和端口都相同，我们就称这 两个 URL 同源。

同源策略 主要表现在 DOM、Web 数据 和网络这三个层面：

DOM 层面

同源策略限制了来自不同源的 JavaScript 脚本对当前 DOM 对象读和写的操作。

跨文档消息机制(window.postMessage)，实现不同源 dom 通信。
Web 数据

同源策略限制了不同源的站点读取当前站点的 Cookie、IndexDB、LocalStorage 等数据。
网络

同源策略限制了通过 XMLHttpRequest 等方式将站点的数据发送给不同源的站点。

跨域资源共享(CORS), 实现跨域请求数据。

35. XSS 攻击

XSS， 跨站脚本攻击，指黑客往 HTML 文件 中或者 DOM 中注入 恶意脚本，从而在 用户浏览页面时 利用注入的 恶意脚本 对用户实施攻击的一种手段。

恶意脚本 的危害:

通过 document.cookie 窃取 cookie 信息，造成用户信息丢失；
监听用户行为

恶意 JavaScript 可以使用 “addEventListener” 接口来监听键盘事件，比如可以获取用户输入的信用卡等信息，将其发送到恶意服务器。黑客掌握了这些信息之后，又可以做很多违法的事情
可以通过修改 DOM 伪造假的登录窗口，用来欺骗用户输入用户名和密码等信息
在页面内生成浮窗广告，这些广告会严重地影响用户体验

恶意脚本注入的方式:

存储型 XSS 攻击

存储型 XSS 攻击 大致需要经过如下步骤：
- 首先黑客利用站点漏洞将一段恶意 JavaScript 代码提交到网站的数据库中；
- 然后用户向网站请求包含了恶意 JavaScript 脚本的页面；
- 当用户浏览该页面的时候，恶意脚本就会将用户的 Cookie 信息等数据上传到服务器。
存储型 XSS 攻击漏洞属于服务端安全漏洞。
反射型 XSS 攻击

用户将一段含有恶意代码的请求提交给 Web 服务器，Web 服务器 接收到请求时，又将恶意代码反射给了 浏览器端，这就是 反射型 XSS 攻击。

恶意代码一般添加到 url 中，然后通过服务器将恶意代码添加到请求页面中。

Web 服务器不会存储反射型 XSS 攻击的恶意脚本，这是和存储型 XSS 攻击不同的地方

反射型 XSS 攻击漏洞属于服务端安全漏洞。
基于 DOM 的 XSS 攻击

基于 DOM 的 XSS 攻击 是不牵涉到页面 Web 服务器 的。

具体来讲，黑客通过各种手段将恶意脚本注入用户的页面中，比如通过网络劫持在页面传输过程中修改 HTML 页面的内容，这种劫持类型很多，有通过 WiFi 路由器劫持的，有通过本地恶意软件来劫持的，它们的共同点是 在 Web 资源传输过程或者在用户使用页面的过程中修改 Web 页面的数据。

基于 DOM 的 XSS 攻击漏洞属于 前端安全漏洞。

要阻止 XSS 攻击，我们可以通过 阻止恶意 JavaScript 脚本的注入 和 恶意消息的发送 来实现。

阻止 XSS 攻击的常用策略:

服务器对输入脚本内容进行过滤或转码;
使用 CSP

CSP 提供了一组丰富的策略指令，可以对页面允许加载的资源进行相当精细的控制。

使用方式:
- http header
  
  Content-Security-Policy: xxx (配置好并启用后，不符合 CSP 的外部资源就会被阻止加载)
  
  Content-Security-Policy-Report-Only: xxx (表示不执行限制选项，只是记录违反限制的行为。它必须与report-uri选项配合使用。)
- 通过 meat 标签在 HTML 中使用
```
<meta http-equiv="content-security-policy" content="策略">
<meta http-equiv="content-security-policy-report-only" content="策略">
```
常见的策略指令:
- base-uri
  
  定义了 URI，它可以作为文档的基准 URL。如果没有指定值，那么任何 URI 都被允许。如果没有指定这条指令，浏览器会使用 base 元素中的 URL
- child-src
  
  指定定义了 web workers 以及嵌套的浏览上下文（如和）的源
- connect-src
  
  定义了请求、XMLHttpRequest、WebSocket 和 EventSource 的连接来源
- default-src、font-src、img-src、media-src 等
- 使用 HttpOnly 标记 cookie，使得无法通过 document.cookie 读取 cookie；

前端知识整理 - 浏览器 & html 篇

1. 使用 chrome 浏览器打开一个页面， 要启动哪些进程？

2. 从输入 url 到页面展示，中间经历了什么过程？

3. 浏览器渲染的过程

4. 事件循环 - event loop

5. requestAnimationFrame

6. 宏任务&微任务

7. 变量提升(Hoisting)

8. 执行上下文(Execution Context)

9. 调用栈(call stack)

10. 作用域(scoped)

11. let & const

12. 作用域链

13. 闭包

14. this

15. new 关键字

16. 静态语言 & 动态语言 & 弱类型语言 & 强类型语言

17. 数据类型

18. 垃圾回收

19. 编译器(compiler) & 解释器(Interpreter)

20. V8 引擎运行 js 代码

21. Babel 的工作流程

22. TCP 可靠传输

23. setTimeout

24. callback

25. Promise

26. DOM

27. CSSOM

28. 解析白屏

29. 分层 & 合成

30. 系统优化页面

31. 渐进式网页应用 - PWA

32. WebComponent

33. 浏览器安全

34. 同源策略

35. XSS 攻击

36. CSRF 攻击

37. https

38. 使用 Performance

39. window.onload 和 DOMContentLoaded

40. 浏览器内核

41. <! DOCTYPE>

42. html 4.01 和 html5 之间的差异

43. SGML

44. HTML的DTD文档

45. XHTML / HTML

46. 标准模式 & 兼容模式

47. html语义化

48. html5 离线存储

49. html5 多线程 - worker

50. 不同标签页面之间的通讯

51. html5 - websocket

52. html5 - Geolocation

53. HTTP状态码

54. html 本地缓存

55. 浏览器缓存机制

56. ETag/If-None-Match 和 Last-Modified/if-Modified-Since 的比较

57. 请求头和响应头中的Cache-control：no-cache

58. meta标签

59. label标签

60. 超链接的常用表现形式

61. 服务发送事件

62. webSocket 和 Server-sent的比较

63. DOM2.0 模型

64. BOM

65. ajax & xhr

66. post 和 get 有什么差别

1. 使用 chrome 浏览器打开一个页面，要启动哪些进程？