这是我参与更文挑战的第12天，活动详情查看：更文挑战

前言

在浏览器输入URL到页面展示，这中间发生了什么？

这是一道经典的题目，学习了李兵大佬的浏览器工作原理，整理了一下学习笔记。

导航流程

用户发出URL请求到页面开始解析的过程，就叫导航流程。

浏览器进程接收用户输入的URL请求，再将该URL转发给网络进程

用户输入URL/查询关键词

浏览器会通过导航栏的查询关键词或URL，根据逻辑规则生成完整的URL地址。

现代的浏览器搜索栏都有内置搜索引擎，当用户输入的是搜索关键词(即不符合URL规则)，则会根据用户设置的浏览器默认搜索引擎，合成带查询关键词的URL。

# 输入查询关键词-github，会根据浏览器默认搜索引擎，合成带查询关键词的URL。
https://www.baidu.com/s?ie=UTF-8&wd=github

如果用户输入的是符合URL规则的内容，则浏览器地址栏会尝试根据URL规则，合成完整的URL

# 输入符合URL规则的内容-github.com
# 由于缺少协议头，则浏览器会尝试为它补全协议头，合成为完整的URL
https://github.com
# 输入符合URL规则的内容-https://www.qq.com/
# 由于它本身便是完整的URL，浏览器不会做任何URL加工
https://www.qq.com/

判断beforeunload事件

在当前页面被替换为新的页面之前，会判断页面有没有beforeunload事件，beforeunload事件常用于完成以下的工作:

页面退出之前的一些数据清理
询问用户是否离开当前页面
取消导航，不执行后续导航流程

window.addEventListener('beforeunload', (event) => {
  // 根据规范，要显示确认，事件处理程序需要在事件上调用preventDefault()
  event.preventDefault();
  // 但是Chrome并没有遵守这个规定，Chrome要求设置returnValue
  event.returnValue = '';
});

如果页面没有监听到beforeunload事件，或者事件已经同意进行后续的导航流程，则浏览器便进入加载状态(浏览器图标进入加载状态)，进行后续导航流程。

发起 URL 请求

在网络进程中发起真正的 URL 请求。

如果浏览器本地缓存了这个资源，则会直接将数据转发给浏览器进程，否则网络进程会接收并解析响应头数据，才会把数据转发给浏览器进程。

URL转发给网络进程

当完成了上述的工作，浏览器进程会通过**IPC(进程间通信)**把URL请求转发给网络进程，网络进程在接收到请求后，会发起真正的URL请求流程。

查找本地资源缓存

网络进程会先查找本地是否缓存了这个资源，如果有缓存，则直接返回资源给浏览器进程。

进入网络请求流程

如果没有查找到缓存资源，则进入网络请求流程。

DNS解析

根据URL查询对应的DNS缓存是否存在，且在有效期内，符合则直接返回缓存存储的服务器IP地址。

如果没有符合的DNS缓存，则会经过DNS服务器解析，得到服务器的IP地址，如果是HTTPS协议，还需要建立TLS连接。

建立TCP连接

利用IP地址和端口号(HTTP默认80端口，HTTPS默认443端口)建立TCP连接(同一域名同时最多只能建立6个TCP连接，超出连接数的请求需排队等待)，随后浏览器会构建请求行，请求头(包含Cookie等数据)，请求体等信息，向服务器发送请求信息。

服务器接收到信息后，会根据请求信息生成响应行、响应头和响应体等响应信息，并发送给网络进程。

网络进程接收到这些信息后，就开始解析响应信息了。

根据状态码处理请求

如果服务器返回的响应头状态码为301或者302

301: 永久重定向，一般用于重定向被移除的资源
302: 暂时重定向，用于临时重定向

则会根据响应头的Location字段，读取新的被重定向后的URL地址，再发起新的 HTTP 或者 HTTPS 请求，此时一切流程又重新开始了。

如果服务器返回的响应头状态码为200(正常响应)，则会根据服务器返回的响应体数据类型(Content-Type)，决定如何显示响应体的内容。

# 告诉浏览器返回的是HTML格式的数据
Content-Type: text/html
# 告诉浏览器返回的数据是字节流类型，通常浏览器会安装下载类型来处理
Content-Type: application/octet-stream

如果是下载类型的数据，浏览器会把它提交给浏览器的下载管理器，此时，这个导航流程也结束了。

如果是HTML，则浏览器会继续进行导航流程。

准备渲染进程

默认情况下，Chrome会为每个页面分配一个渲染进程(每打开一个新页面就会配套创建一个新的渲染进程)。

但是在同一站点的情况下，多个页面会复用同一个渲染进程，Chrome官方把这个默认策略叫 process-per-site-instance。

同一站点（same-site）

满足以下所有条件，则表示为统一站点

根域名相同
协议相同

同一域名的条件只判断根域名和协议，所以，同一站点的定义还包含了该根域名下的所有子域名和不同端口。

# 这些情况都属于同一个站点
https://www.github.com
https://api.github.com
https://www.github.com:8081

提交文档

当浏览器进程接收到网络进程的响应头数据后，便向渲染进程发起"提交文档"的信息。
渲染进程接收到"提交文档"的信息后，会和网络进程建立数据传输的"管道"。
等待文档数据传输完成后，渲染进程会返回"确认提交"的信息给浏览器进程。
浏览器进程接收到"确认提交"的消息后，便开始移除之前旧的文档，然后更新浏览器的界面状态(包括了安全状态、地址栏的 URL、前进后退的历史状态)，并更新页面（从此前 URL 网络请求时的逆时针旋转，即将变成顺时针旋转）。

到这里，一个完整的导航流程就完成了，这之后就要进入渲染阶段了。

渲染流程的笔记会放到下一篇文章。

从输入URL到页面展示，这中间发生了什么？(导航流程篇)

前言