前言
“在浏览器里,从输入 URL 到页面展示,这中间发生了什么? ”这是一道经典的面试题,能够全面的考察知识的掌握程度,其中涉及到了网络、操作系统、Web 等一系列的知识。但是大多数人只能回答其中部分零散的知识点,并不能将这些知识点串联成线,无法系统而又全面地回答这个问题。
今天我把这个流程梳理了一遍,画了一个很详细的流程图,篇幅太长,所以把流程图放在以下链接里,自取。
示意图
简化版示意图:
先回顾一下各进程的指责,具体的可查看上篇文章《Chrome: 仅仅打开了1个页面,为什么有4个进程?》来了解多进程浏览器架构。
浏览器进程:主要负责界面显示、用户交互、子进程管理,文件存储等功能。
网络进程:主要负责页面的网络资源加载。
渲染进程:核心任务是将 HTML、CSS 和 JavaScript 转换为用户可以与之交互的网页,因为渲染进程所有的内容都是通过网络获取的,会存在一些恶意代码利用浏览器漏洞对系统进行攻击,所以运行在渲染进程里面的代码是不被信任的。这也是为什么 Chrome 会让渲染进程运行在安全沙箱里,就是为了保证系统的安全。
导航流程
- 首先,浏览器进程接收到用户输入的 URL 请求,浏览器进程便将该 URL 转发给网络进程。
- 然后,在网络进程中发起真正的 URL 请求。
- 接着网络进程接收到了响应头数据,便解析响应头数据,并将数据转发给浏览器进程。
- 浏览器进程接收到网络进程的响应头数据之后,发送“提交导航”消息到渲染进程;
- 渲染进程接收到“提交导航”的消息之后,便开始准备接收 HTML 数据,接收数据的方式是直接和网络进程建立数据管道;
- 最后渲染进程会向浏览器进程“确认提交”,这是告诉浏览器进程:“已经准备好接受和解析页面数据了”
- 浏览器进程接收到渲染进程“提交文档”的消息之后,便开始移除之前旧的文档,然后更新浏览器进程中的页面状态。
其中,用户发出 URL 请求到页面开始解析的这个过程,就叫做导航。
用户输入
当用户在地址栏中输入一个查询关键字时,地址栏会判断输入的关键字是搜索内容,还是请求的 URL。
- 如果是搜索内容,地址栏会使用浏览器默认的搜索引擎,来合成新的带搜索关键字的 URL。
- 如果判断输入内容符合 URL 规则,比如输入的是 juejin.cn ,那么地址栏会根据规则,把这段内容加上协议,合成为完整的 URL:juejin.cn
输入回车后,浏览器还给了当前页面一次执行 beforeunload 事件的机会,beforeunload 事件允许页面在退出之前执行一些数据清理操作,还可以询问用户是否要离开当前页面,比如当前页面可能有未提交完成的表单等情况,因此用户可以通过 beforeunload 事件来取消导航,让浏览器不再执行任何后续工作。
当前页面没有监听 beforeunload 事件或者同意了继续后续流程,那么浏览器便进入下图的状态:
从图中可以看出,当浏览器刚开始加载一个地址之后,标签页上的图标便进入了加载状态。但此时图中页面显示的依然是之前打开的页面内容,并没立即替换为新的页面。因为需要等待提交文档阶段,页面内容才会被替换。
URL 请求阶段
接下来,便进入了页面资源请求过程。这时,浏览器进程会通过进程间通信(IPC)把 URL 请求发送至网络进程,网络进程接收到 URL 请求后,会在这里发起真正的 URL 请求流程。
1、本地缓存查找
网络进程会查找本地缓存是否缓存了该资源。如果有缓存资源,那么直接返回资源给浏览器进程;如果在缓存中没有查找到资源,那么直接进入网络请求流程
2、DNS 解析
获取请求域名的服务器 IP 地址。
3、建立 TCP 连接
利用 IP 地址和服务器建立 TCP 连接。连接建立之后,浏览器端会构建请求行、请求头等信息,并把和该域名相关的 Cookie 等数据附加到请求头中,然后向服务器发送构建的请求信息。
响应阶段
服务器接收到请求信息后,会根据请求信息生成响应数据(包括响应行、响应头和响应体等信息),并发给网络进程。等网络进程接收了响应行和响应头之后,就开始解析响应头的内容了。
1、状态码处理
- 301 / 302,说明服务器需要浏览器重定向到其他 URL。这时网络进程会从响应数据的 Location 字段里面读取重定向的地址,然后再发起新的请求,一切又重头开始了。
- 200: 继续处理请求。
2、响应数据类型处理
Content-Type 是 HTTP 头中一个非常重要的字段, 它告诉浏览器服务器返回的响应体数据是什么类型,然后浏览器会根据 Content-Type 的值来决定如何显示响应体的内容。
- Content-Type 的值是 application/octet-stream,返回数据是字节流类型的,浏览器判断为下载类型,那么该请求会被提交给浏览器的下载管理器,同时该 URL 请求的导航流程就此结束。
- Content-type 字段的值是 text/html,说明返回数据是 HTML 格式,浏览器则会继续进行导航流程,准备渲染进程进行页面解析渲染。
提交文档阶段
-
通常情况下,打开新的页面都会使用单独的渲染进程。
-
属于同一站点的话,则复用之前的渲染进程。
准备好渲染进程后,进入了提交文档阶段:指浏览器进程将网络进程接收到的 HTML 数据提交给渲染进程。
- 首先当浏览器进程接收到网络进程的响应头数据之后,便向渲染进程发起“提交文档”的消息;
- 渲染进程接收到“提交文档”的消息后,会和网络进程建立传输数据的“管道”;
- 等文档数据传输完成之后,渲染进程会返回“确认提交”的消息给浏览器进程;
- 浏览器进程在收到“确认提交”的消息后,会更新浏览器界面状态,包括了安全状态、地址栏的 URL、前进后退的历史状态,并更新 Web 页面。
这也就解释了为什么在浏览器的地址栏里面输入了一个地址后,之前的页面没有立马消失,而是要加载一会儿才会更新页面。
渲染阶段
一旦文档被提交,渲染进程便开始页面解析和子资源加载了.
详细的页面解析过程,下一篇会持续更新。
一旦页面生成完成,渲染进程会发送一个消息给浏览器进程,浏览器接收到消息后,会停止 tab 标签图标上的加载动画。
总结
总的流程,可这样描述:
1、用户输入
- 1.1、协议组装;
- 1.2、IPC: 把url请求发送给网络进程;
- 1.3、查找本地缓存;
- 1.4、DNS 解析:获取服务器ip地址;
- 1.5、建立 TCP 连接;
- 1.6、构建请求头信息;
- 1.7 发送请求头信息;
2、响应阶段
- 2.1、状态码解析:301 / 302 / 200;
- 2.2、响应类型的处理:Content-type;
- 2.3、Content-type=text/html,准备渲染进程进行解析;
3、提交阶段
- 3.1、分配渲染进程:同站点复用父渲染进程;
- 3.2、浏览器进程向渲染进程发起“提交文档”的消息;
- 3.3、渲染进程接收后,与网络进程建立消息传输通道;
- 3.4、文档传输完后,向浏览器进程发送“确认提交”的消息;
- 3.5、浏览器进程接收后,更新浏览器界面等信息;
4、渲染阶段
- 渲染进程进行资源的解析,显示
问题清单
- tab 标签页上的加载图标什么时候进行加载,什么时候停止加载?
输入url后,如果没有清退事件,标签页上的图标便进入了加载状态。
当生成页面后,渲染进程发消息给浏览器进程,这时候,加载图标停止加载。
- 旧页面什么时候消失,即显示空白?
当渲染进程接收完数据后,提交文档到浏览器进程,这时候才会更新页面。